Meinungsklima.de db24211_9 http://www.meinungsklima.de/index.php?title=Hauptseite MediaWiki 1.34.0 first-letter Medium Spezial Diskussion Benutzer Benutzer Diskussion Meinungsklima.de Meinungsklima.de Diskussion Datei Datei Diskussion MediaWiki MediaWiki Diskussion Vorlage Vorlage Diskussion Hilfe Hilfe Diskussion Kategorie Kategorie Diskussion Hauptseite 0 1 1 2019-04-13T15:20:08Z MediaWiki default 0 wikitext text/x-wiki <strong>MediaWiki wurde installiert.</strong> Hilfe zur Benutzung und Konfiguration der Wiki-Software findest du im [https://www.mediawiki.org/wiki/Special:MyLanguage/Help:Contents Benutzerhandbuch]. == Starthilfen == * [https://www.mediawiki.org/wiki/Special:MyLanguage/Manual:Configuration_settings Liste der Konfigurationsvariablen] * [https://www.mediawiki.org/wiki/Special:MyLanguage/Manual:FAQ MediaWiki-FAQ] * [https://lists.wikimedia.org/mailman/listinfo/mediawiki-announce Mailingliste neuer MediaWiki-Versionen] * [https://www.mediawiki.org/wiki/Special:MyLanguage/Localisation#Translation_resources Übersetze MediaWiki für deine Sprache] * [https://www.mediawiki.org/wiki/Special:MyLanguage/Manual:Combating_spam Erfahre, wie du Spam auf deinem Wiki bekämpfen kannst] 8062e6779a3e8d3abdafec671fb965a3cba24236 2 1 2019-04-13T15:24:58Z Trg 1 Hinweis wikitext text/x-wiki <strong>Die Reparaturarbeiten laufen.</strong> Wegen eines Problems mit Updates muss diese Webseite neu aufgebaut werden. Das wird einige Zeit dauern. ec399d0860812557d395838116acff06210c249d 12 2 2019-04-13T16:05:59Z Trg 1 SPSS-Verweis wikitext text/x-wiki <strong>Die Reparaturarbeiten laufen.</strong> Wegen eines Problems mit Updates muss diese Webseite neu aufgebaut werden. Das wird einige Zeit dauern. ==SPSS-Kurs-Materialien == Im Wiederaufbau begriffen. *[[:Kategorie:SPSS-Kurs]] 56bf7a31e960627b32916ae8e27d40ae45a9172d Meinungsklima.de:Über Meinungsklima.de 4 2 3 2019-04-13T15:28:50Z Trg 1 Angelegt wikitext text/x-wiki Meinungsklima.de informiert über sozialwissenschaftliche Themen. Die Seie nutzt Mediawiki als Content-management-System, ist aber nicht als Wiki frei bearbeitbar. Die Inhalte stehen nicht unter einer freien Lizenz und sind auch nicht gemeinfrei. Falls jemand Inhalte dieser Seite nutzen möchte, bitte per E-mail bei mir nachfragen: thomas@roessing.org. [http://impressum.trgsites.net/ Impressum] 61c04757b11e2536d2da273ed415189312cff6dd 15 3 2019-04-13T16:10:40Z Trg 1 typo wikitext text/x-wiki Meinungsklima.de informiert über sozialwissenschaftliche Themen. Die Seite nutzt Mediawiki als Content-management-System, ist aber nicht als Wiki frei bearbeitbar. Die Inhalte stehen nicht unter einer freien Lizenz und sind auch nicht gemeinfrei. Falls jemand Inhalte dieser Seite nutzen möchte, bitte per E-mail bei mir nachfragen: thomas@roessing.org. [http://impressum.trgsites.net/ Impressum] 62fa68a2367c8f78afe22ac04c8efc5b1c69cf1f Meinungsklima.de:Datenschutz 4 3 4 2019-04-13T15:29:39Z Trg 1 Angelegt wikitext text/x-wiki [http://impressum.trgsites.net/ Impressum/Datenschutzhinweis] a455a515d3dfa0ac4cc7c55828f5811ada7c17e7 Meinungsklima.de:Impressum 4 4 5 2019-04-13T15:40:17Z Trg 1 - wikitext text/x-wiki - 3bc15c8aae3e4124dd409035f32ea2fd6835efc9 17 5 2019-04-13T16:16:13Z Trg 1 Link wikitext text/x-wiki [http://impressum.trgsites.net/ Impressum] 5d64947e7d72aeac77e5881fdd1eeb3dafb2b167 SPSS: Einführung 0 5 6 2019-04-13T15:48:44Z Trg 1 Wiederhergestellt wikitext text/x-wiki '''SPSS''' ist eine Statistiksoftware, die besonders auf die Bedürfnisse der Sozialwissenschaften zugeschnitten ist. Die folgenden Ausführungen beziehen sich auf die Versionen 13 bis 15, die an der Universität Mainz verwendet wurden, als der Autor dort SPSS-Kurse gegeben hat. Viele Hinweise sind jedoch auch für Versionen mit niedrigeren Versionszahlen gültig, z.B. für Version 12 und werden sicherlich auch in Zukunft durch neuere Versionen nicht unbrauchbar. ==Programmstart und Hauptfenster == Neben einer großen Tabelle, in der später die Daten angezeigt werden, hat man folgende Menüs zur Verfügung: *Datei. Ein von anderen Windows-Programmen her bekanntes Menü zum Öffnen und Schließen von Dateien sowie zum Beenden des Programms. *Bearbeiten. Auch dieses Menü mit Funktionen zum Ausschneiden, Kopieren und Einfügen ist aus anderen Windows-Programmen bekannt. Hier findet man auch den Menüpunkt „Optionen“ für das Programm. *Ansicht. Mit diesem Menü kann man die Oberfläche des SPSS-Fensters anpassen oder zur Variablen-Ansicht umschalten. *Daten. Dieses Menü ist wichtig für das Bearbeiten, Verwalten, Anpassen und Umformen der SPSS-Daten. Hier finden sich beispielsweise die Funktionen Fälle sortieren und filtern. *Transformieren. Manchmal müssen Daten umgeformt werden, bevor man Berechnungen durchführen kann. Dafür stehen in diesem Menü einige Funktionen zur Verfügung. *Analysieren. Dieses Menü ist das wichtigste für die Datenauswertung. Hier sind alle Auswertungsfunktionen ansteuerbar (die Menge der zur Verfügung stehenden Optionen kann je nach Lizenz variieren). Einige Punkte aus dem Menü ‚Analysieren’, die besonders wichtig sind: **Deskriptive Statistiken (z.B. Häufigkeiten, Kreuztabellen) **Mittelwerte vergleichen (z.B. für die Auswertung von Experimenten) **Allgemeines Lineares Modell (Varianzanalyse) **Korrelation **Regression **Mehrfachantworten *Grafiken. Manche Analysen lassen sich grafisch besser veranschaulichen. *Extras. Spezialfunktionen. *Fenster. Fensterverwaltung (bekannt aus anderen Windows-Programmen). *Hilfe. [[Kategorie:SPSS-Kurs]] f138a5efe8a4c2e19f102a3ea0fb4517688443ca SPSS: Fenster und Ansichten 0 6 7 2019-04-13T15:55:24Z Trg 1 Wiederherstellung wikitext text/x-wiki Im SPSS-Datenfenster gibt es die Datenansicht und die Variablenansicht. Außerdem gibt es bei SPSS noch ein Syntaxfenster und ein Ausgabefenster. == Datenansicht == In der Datenansicht ist jede Zeile ein Fall, zum Beispiel ein Befragter oder ein Zeitungsartikel bei einer Inhaltsanalyse. In den Spalten stehen die Variablen (siehe: [[Daten eingeben]]) == Variablenansicht == Die Variablenansicht erreicht man über das Menü Ansicht, oder über die Umschaltfläche am unteren Rand der großen Tabelle. In der Variablenansicht ist jede Zeile eine Variable. In den Spalten können dieser Variable Eigenschaften zugewiesen werden. == Syntaxfenster == Das SPSS-Syntaxfenster öffnet man im Menü Datei|Neu|Syntax. Hier kann man SPSS--Befehle direkt eintragen, was die Arbeit bei manchen Operationen am Datensatz oder bestimmten, immer wiederkehrenden Auswertungsschritten erleichtert. Der Umgang mit der SPSS-Syntax wird in dieser Einführung jedoch allenfalls am Rande behandelt. == Ausgabefenster == Das SPSS-Ausgabefenster enthält die Ausgaben von Analyseoperationen und Fehlermeldungen. Es öffnet sich automatisch, wenn man im Menü 'Analysieren' eine Analyse durchführt, oder wenn eine Fehlermeldung auftritt. Dort werden beispielsweise Tabellen und Graphiken angezeigt. Das Ausgabefenster ist zweigeteilt. Links steht eine Übersicht der Ausgaben (die man zum Drucken oder löschen auch markieren kann), rechts stehen die eigentlichen Ergebnisse bzw. Meldungen. [[Kategorie: SPSS-Kurs]] 09948fa8e3474b29ef4b43759c1d0114c7706e39 Variablen definieren 0 7 8 2019-04-13T15:58:48Z Trg 1 Wiederherstellung wikitext text/x-wiki Hier wird zuerst allgemein und dann an einem einfachen Beispiel erklärt, wie man vorgehen muß, wenn man einen Datensatz neu anlegt. == Erstellen der Datenoberfläche == Bevor man Daten eingeben kann, müssen die Variablen definiert werden. Dazu wechselt man zur Variablenansicht. Beim Definieren der Variablen kann man mehrere Einstellungen für die Variablen vornehmen, die das Verhalten von SPSS beim Rechnen mit diesen Variablen steuern und teilweise die Arbeit erheblich erleichtern. Name Variablennamen in SPSS durften früher maximal acht Zeichen lang sein (in den neuen Versionen ist das anders, aber im Interesse der Übersichtlichkeit und der Abwärtskompatibilität kann es nicht schaden, sich weiterhin an diesen Grundsatz zu halten). Variablennamen sollten möglichst ‚sprechend’ sein, also dem Nutzer einen Anhaltspunkt geben, was in dieser Variable gespeichert wird. Variablennamen wie ‚Wert1’ ‚Wert2’ etc. sind spätestens bei der Auswertung sehr verwirrend. ===Typ=== Hier wird in einem Auswahlfenster festgelegt, um welchen Typ Variable es sich handelt. Am häufigsten sind numerische Variablen (z.B. 1 für männlich, 2 für weiblich, Alter, Körpergröße etc.). Stringvariablen enthalten Texte. Sie sind sehr schwer auszuwerten. Für numerische Variablen kann man zusätzlich die Zahl der Stellen und der Nachkommastellen angeben. Achtung: Wenn negative Werte vorkommen können (z.B. bei der Bewertung von Politikern auf einer Stapel-Skala), muß für das Minus-Zeichen eine Stelle reserviert werden. ===Spaltenformat und Dezimalstellen=== Hier werden bei numerischen Variablen die unter ‚Typ’ erwähnten Angaben über die Zahl der Stellen festgelegt. ===Variablenlabel=== Eine Bezeichnung für die Variable, die auch mehr als acht Zeichen umfassen darf. Bei Auswertungen wird dieses Label mit angegeben, so daß man weiß, worum es in der analysierten Variable überhaupt geht. Beispielsweise kann man der Variable POLPRAEF das Variablenlabel ‚Politische Präferenz’ zuordnen. Das ist dann etwas klarer als der bloße Variablenname. ===Wertelabels=== Wenn man z.B. eine 1 für männlich und eine 2 für weiblich in den Datensatz einträgt, kann man den Werten in diesem Menü Bezeichnungen zuweisen. Sie werden bei Auswertungen mit ausgegeben. Man muß immer daran denken nach der Eingabe eines Wertelabels ‚Hinzufügen’ zu klicken, sonst funktioniert das Abschließen des Vorgangs mit ‚OK’ nicht richtig. 304e4e659caa22f130c217a42636e2d8112c8541 9 8 2019-04-13T16:00:21Z Trg 1 /* Erstellen der Datenoberfläche */ Wiederherstellung wikitext text/x-wiki Hier wird zuerst allgemein und dann an einem einfachen Beispiel erklärt, wie man vorgehen muß, wenn man einen Datensatz neu anlegt. == Erstellen der Datenoberfläche == Bevor man Daten eingeben kann, müssen die Variablen definiert werden. Dazu wechselt man zur Variablenansicht. Beim Definieren der Variablen kann man mehrere Einstellungen für die Variablen vornehmen, die das Verhalten von SPSS beim Rechnen mit diesen Variablen steuern und teilweise die Arbeit erheblich erleichtern. Name Variablennamen in SPSS durften früher maximal acht Zeichen lang sein (in den neuen Versionen ist das anders, aber im Interesse der Übersichtlichkeit und der Abwärtskompatibilität kann es nicht schaden, sich weiterhin an diesen Grundsatz zu halten). Variablennamen sollten möglichst ‚sprechend’ sein, also dem Nutzer einen Anhaltspunkt geben, was in dieser Variable gespeichert wird. Variablennamen wie ‚Wert1’ ‚Wert2’ etc. sind spätestens bei der Auswertung sehr verwirrend. ===Typ=== Hier wird in einem Auswahlfenster festgelegt, um welchen Typ Variable es sich handelt. Am häufigsten sind numerische Variablen (z.B. 1 für männlich, 2 für weiblich, Alter, Körpergröße etc.). Stringvariablen enthalten Texte. Sie sind sehr schwer auszuwerten. Für numerische Variablen kann man zusätzlich die Zahl der Stellen und der Nachkommastellen angeben. Achtung: Wenn negative Werte vorkommen können (z.B. bei der Bewertung von Politikern auf einer Stapel-Skala), muß für das Minus-Zeichen eine Stelle reserviert werden. ===Spaltenformat und Dezimalstellen=== Hier werden bei numerischen Variablen die unter ‚Typ’ erwähnten Angaben über die Zahl der Stellen festgelegt. ===Variablenlabel=== Eine Bezeichnung für die Variable, die auch mehr als acht Zeichen umfassen darf. Bei Auswertungen wird dieses Label mit angegeben, so daß man weiß, worum es in der analysierten Variable überhaupt geht. Beispielsweise kann man der Variable POLPRAEF das Variablenlabel ‚Politische Präferenz’ zuordnen. Das ist dann etwas klarer als der bloße Variablenname. ===Wertelabels=== Wenn man z.B. eine 1 für männlich und eine 2 für weiblich in den Datensatz einträgt, kann man den Werten in diesem Menü Bezeichnungen zuweisen. Sie werden bei Auswertungen mit ausgegeben. Man muß immer daran denken nach der Eingabe eines Wertelabels ‚Hinzufügen’ zu klicken, sonst funktioniert das Abschließen des Vorgangs mit ‚OK’ nicht richtig. ===Fehlende Werte=== Hier wird festgelegt, daß bestimmte Werte bei der Analyse nicht berücksichtigt werden sollen. Das ist beispielsweise dann nötig wenn man z.B. 9 für ‚keine Angabe’ verschlüsselt hat und nur mit den Fällen rechnen möchte, in denen eine Angabe gemacht wurde. Dann setzt man die 9 an dieser Stelle als ‚fehlenden Wert’ ein. Speziell bei Mittelwertvergleichen muß darauf geachtet werden, daß Sonderverschlüsselungen (wie 999 := "Alter nicht angegeben") bei der Berechnung der Mittelwerte nicht berücksichtigt werden. ===Spalten und Ausrichtung=== Mit diesen Einstellungen kann man das Aussehen der großen Datentabelle (‚Datenmatrix’) verändern. ===Messniveau=== Hier kann man einstellen, welches Datenniveau diese Variable haben soll. SPSS bietet drei Skalenniveaus an: *Metrisch. Damit sind Ratioskalen (mit absolutem Nullpunkt, z.B. Alter) und Intervallskalen (mit willkürlichem Nullpunkt, z.B. Grad Celsius) gemeint. *Ordinal. Ordinalskalen bringen Werte in eine Reihenfolge, ohne daß gesichert wäre, daß die Abstände zwischen den Skalenpunkten gleich sind. Beispiel: Schulnoten. *Nominal. Nominalskalen sind einfache Zuweisungen von Zahlen zu Ausprägungen, z.B. 1 für ‚männlich’ und 2 für ‚weiblich’. Das Meßniveau bestimmt, wie man mit den Daten der Variable rechnen kann. Manchmal ist es sinnvoll (bzw. wird einfach so gemacht), mehr zu berechnen, als man eigentlich darf. Deshalb ist es nicht verkehrt, das Meßniveau bei allen Variablen auf ‚Metrisch’ stehen zu lassen. Man muß dann lediglich beim Rechnen selbst daran denken, was man mit welchen Daten rechnen kann, und was nicht. f2ea73e60fd902b61d6146c7ce223c1bb48a2fcd 10 9 2019-04-13T16:01:45Z Trg 1 Wiederherstellung wikitext text/x-wiki Hier wird zuerst allgemein und dann an einem einfachen Beispiel erklärt, wie man vorgehen muß, wenn man einen Datensatz neu anlegt. == Erstellen der Datenoberfläche == Bevor man Daten eingeben kann, müssen die Variablen definiert werden. Dazu wechselt man zur Variablenansicht. Beim Definieren der Variablen kann man mehrere Einstellungen für die Variablen vornehmen, die das Verhalten von SPSS beim Rechnen mit diesen Variablen steuern und teilweise die Arbeit erheblich erleichtern. Name Variablennamen in SPSS durften früher maximal acht Zeichen lang sein (in den neuen Versionen ist das anders, aber im Interesse der Übersichtlichkeit und der Abwärtskompatibilität kann es nicht schaden, sich weiterhin an diesen Grundsatz zu halten). Variablennamen sollten möglichst ‚sprechend’ sein, also dem Nutzer einen Anhaltspunkt geben, was in dieser Variable gespeichert wird. Variablennamen wie ‚Wert1’ ‚Wert2’ etc. sind spätestens bei der Auswertung sehr verwirrend. ===Typ=== Hier wird in einem Auswahlfenster festgelegt, um welchen Typ Variable es sich handelt. Am häufigsten sind numerische Variablen (z.B. 1 für männlich, 2 für weiblich, Alter, Körpergröße etc.). Stringvariablen enthalten Texte. Sie sind sehr schwer auszuwerten. Für numerische Variablen kann man zusätzlich die Zahl der Stellen und der Nachkommastellen angeben. Achtung: Wenn negative Werte vorkommen können (z.B. bei der Bewertung von Politikern auf einer Stapel-Skala), muß für das Minus-Zeichen eine Stelle reserviert werden. ===Spaltenformat und Dezimalstellen=== Hier werden bei numerischen Variablen die unter ‚Typ’ erwähnten Angaben über die Zahl der Stellen festgelegt. ===Variablenlabel=== Eine Bezeichnung für die Variable, die auch mehr als acht Zeichen umfassen darf. Bei Auswertungen wird dieses Label mit angegeben, so daß man weiß, worum es in der analysierten Variable überhaupt geht. Beispielsweise kann man der Variable POLPRAEF das Variablenlabel ‚Politische Präferenz’ zuordnen. Das ist dann etwas klarer als der bloße Variablenname. ===Wertelabels=== Wenn man z.B. eine 1 für männlich und eine 2 für weiblich in den Datensatz einträgt, kann man den Werten in diesem Menü Bezeichnungen zuweisen. Sie werden bei Auswertungen mit ausgegeben. Man muß immer daran denken nach der Eingabe eines Wertelabels ‚Hinzufügen’ zu klicken, sonst funktioniert das Abschließen des Vorgangs mit ‚OK’ nicht richtig. ===Fehlende Werte=== Hier wird festgelegt, daß bestimmte Werte bei der Analyse nicht berücksichtigt werden sollen. Das ist beispielsweise dann nötig wenn man z.B. 9 für ‚keine Angabe’ verschlüsselt hat und nur mit den Fällen rechnen möchte, in denen eine Angabe gemacht wurde. Dann setzt man die 9 an dieser Stelle als ‚fehlenden Wert’ ein. Speziell bei Mittelwertvergleichen muß darauf geachtet werden, daß Sonderverschlüsselungen (wie 999 := "Alter nicht angegeben") bei der Berechnung der Mittelwerte nicht berücksichtigt werden. ===Spalten und Ausrichtung=== Mit diesen Einstellungen kann man das Aussehen der großen Datentabelle (‚Datenmatrix’) verändern. ===Messniveau=== Hier kann man einstellen, welches Datenniveau diese Variable haben soll. SPSS bietet drei Skalenniveaus an: *Metrisch. Damit sind Ratioskalen (mit absolutem Nullpunkt, z.B. Alter) und Intervallskalen (mit willkürlichem Nullpunkt, z.B. Grad Celsius) gemeint. *Ordinal. Ordinalskalen bringen Werte in eine Reihenfolge, ohne daß gesichert wäre, daß die Abstände zwischen den Skalenpunkten gleich sind. Beispiel: Schulnoten. *Nominal. Nominalskalen sind einfache Zuweisungen von Zahlen zu Ausprägungen, z.B. 1 für ‚männlich’ und 2 für ‚weiblich’. Das Meßniveau bestimmt, wie man mit den Daten der Variable rechnen kann. Manchmal ist es sinnvoll (bzw. wird einfach so gemacht), mehr zu berechnen, als man eigentlich darf. Deshalb ist es nicht verkehrt, das Meßniveau bei allen Variablen auf ‚Metrisch’ stehen zu lassen. Man muß dann lediglich beim Rechnen selbst daran denken, was man mit welchen Daten rechnen kann, und was nicht. ==Beispiel== Ein Beispiel für einen sehr einfachen Datensatz, der z.B. aus einem sozialwissenschaftlichen Experiment stammen könnte: Folgende Daten liegen auf den DIN-A4-Fragebögen vor: Gruppe (gehört der Befragte zur Experimentalgruppe A oder zur Kontrollgruppe B?) Geschlecht Alter Meinung über die SPD (fünfteilige Skala) Meinung über die CDU (fünfteilige Skala) Folgendermaßen kann die Umsetzung in SPSS-Variablen aussehen (wobei hier davon ausgegangen wird, daß Variablennamen nur acht Zeichen lang sein können, wie das bei früheren SPSS-Versionen der Fall war); genannt werden der Variablenname, die Ausprägungen und die empfohlenen Variablenlabels und das (offizielle) Meßniveau: GRUPPE: 1=Experimentalgruppe; 2=Kontrollgruppe (Nominalskala) SEX: 1=männlich; 2=weiblich; 9=keine Angabe (Nominalskala) ALTER: Alter in Jahren (Ratioskala/metrisch) SPDMNG: 1=sehr schlechte Meinung über die SPD; 3=ambivalente Meinung über die SPD; 5=sehr gute Meinung über die SPD; 9=keine Angabe (Ordinalskala) CDUMNG: 1=sehr schlechte Meinung über die CDU; 3=ambivalente Meinung über die CDU; 5=sehr gute Meinung über die CDU; 9=keine Angabe (Ordinalskala) 58dbe27b39a4b1f3fdf5bed6d991d15229674572 11 10 2019-04-13T16:02:40Z Trg 1 +Kat wikitext text/x-wiki Hier wird zuerst allgemein und dann an einem einfachen Beispiel erklärt, wie man vorgehen muß, wenn man einen Datensatz neu anlegt. == Erstellen der Datenoberfläche == Bevor man Daten eingeben kann, müssen die Variablen definiert werden. Dazu wechselt man zur Variablenansicht. Beim Definieren der Variablen kann man mehrere Einstellungen für die Variablen vornehmen, die das Verhalten von SPSS beim Rechnen mit diesen Variablen steuern und teilweise die Arbeit erheblich erleichtern. Name Variablennamen in SPSS durften früher maximal acht Zeichen lang sein (in den neuen Versionen ist das anders, aber im Interesse der Übersichtlichkeit und der Abwärtskompatibilität kann es nicht schaden, sich weiterhin an diesen Grundsatz zu halten). Variablennamen sollten möglichst ‚sprechend’ sein, also dem Nutzer einen Anhaltspunkt geben, was in dieser Variable gespeichert wird. Variablennamen wie ‚Wert1’ ‚Wert2’ etc. sind spätestens bei der Auswertung sehr verwirrend. ===Typ=== Hier wird in einem Auswahlfenster festgelegt, um welchen Typ Variable es sich handelt. Am häufigsten sind numerische Variablen (z.B. 1 für männlich, 2 für weiblich, Alter, Körpergröße etc.). Stringvariablen enthalten Texte. Sie sind sehr schwer auszuwerten. Für numerische Variablen kann man zusätzlich die Zahl der Stellen und der Nachkommastellen angeben. Achtung: Wenn negative Werte vorkommen können (z.B. bei der Bewertung von Politikern auf einer Stapel-Skala), muß für das Minus-Zeichen eine Stelle reserviert werden. ===Spaltenformat und Dezimalstellen=== Hier werden bei numerischen Variablen die unter ‚Typ’ erwähnten Angaben über die Zahl der Stellen festgelegt. ===Variablenlabel=== Eine Bezeichnung für die Variable, die auch mehr als acht Zeichen umfassen darf. Bei Auswertungen wird dieses Label mit angegeben, so daß man weiß, worum es in der analysierten Variable überhaupt geht. Beispielsweise kann man der Variable POLPRAEF das Variablenlabel ‚Politische Präferenz’ zuordnen. Das ist dann etwas klarer als der bloße Variablenname. ===Wertelabels=== Wenn man z.B. eine 1 für männlich und eine 2 für weiblich in den Datensatz einträgt, kann man den Werten in diesem Menü Bezeichnungen zuweisen. Sie werden bei Auswertungen mit ausgegeben. Man muß immer daran denken nach der Eingabe eines Wertelabels ‚Hinzufügen’ zu klicken, sonst funktioniert das Abschließen des Vorgangs mit ‚OK’ nicht richtig. ===Fehlende Werte=== Hier wird festgelegt, daß bestimmte Werte bei der Analyse nicht berücksichtigt werden sollen. Das ist beispielsweise dann nötig wenn man z.B. 9 für ‚keine Angabe’ verschlüsselt hat und nur mit den Fällen rechnen möchte, in denen eine Angabe gemacht wurde. Dann setzt man die 9 an dieser Stelle als ‚fehlenden Wert’ ein. Speziell bei Mittelwertvergleichen muß darauf geachtet werden, daß Sonderverschlüsselungen (wie 999 := "Alter nicht angegeben") bei der Berechnung der Mittelwerte nicht berücksichtigt werden. ===Spalten und Ausrichtung=== Mit diesen Einstellungen kann man das Aussehen der großen Datentabelle (‚Datenmatrix’) verändern. ===Messniveau=== Hier kann man einstellen, welches Datenniveau diese Variable haben soll. SPSS bietet drei Skalenniveaus an: *Metrisch. Damit sind Ratioskalen (mit absolutem Nullpunkt, z.B. Alter) und Intervallskalen (mit willkürlichem Nullpunkt, z.B. Grad Celsius) gemeint. *Ordinal. Ordinalskalen bringen Werte in eine Reihenfolge, ohne daß gesichert wäre, daß die Abstände zwischen den Skalenpunkten gleich sind. Beispiel: Schulnoten. *Nominal. Nominalskalen sind einfache Zuweisungen von Zahlen zu Ausprägungen, z.B. 1 für ‚männlich’ und 2 für ‚weiblich’. Das Meßniveau bestimmt, wie man mit den Daten der Variable rechnen kann. Manchmal ist es sinnvoll (bzw. wird einfach so gemacht), mehr zu berechnen, als man eigentlich darf. Deshalb ist es nicht verkehrt, das Meßniveau bei allen Variablen auf ‚Metrisch’ stehen zu lassen. Man muß dann lediglich beim Rechnen selbst daran denken, was man mit welchen Daten rechnen kann, und was nicht. ==Beispiel== Ein Beispiel für einen sehr einfachen Datensatz, der z.B. aus einem sozialwissenschaftlichen Experiment stammen könnte: Folgende Daten liegen auf den DIN-A4-Fragebögen vor: Gruppe (gehört der Befragte zur Experimentalgruppe A oder zur Kontrollgruppe B?) Geschlecht Alter Meinung über die SPD (fünfteilige Skala) Meinung über die CDU (fünfteilige Skala) Folgendermaßen kann die Umsetzung in SPSS-Variablen aussehen (wobei hier davon ausgegangen wird, daß Variablennamen nur acht Zeichen lang sein können, wie das bei früheren SPSS-Versionen der Fall war); genannt werden der Variablenname, die Ausprägungen und die empfohlenen Variablenlabels und das (offizielle) Meßniveau: GRUPPE: 1=Experimentalgruppe; 2=Kontrollgruppe (Nominalskala) SEX: 1=männlich; 2=weiblich; 9=keine Angabe (Nominalskala) ALTER: Alter in Jahren (Ratioskala/metrisch) SPDMNG: 1=sehr schlechte Meinung über die SPD; 3=ambivalente Meinung über die SPD; 5=sehr gute Meinung über die SPD; 9=keine Angabe (Ordinalskala) CDUMNG: 1=sehr schlechte Meinung über die CDU; 3=ambivalente Meinung über die CDU; 5=sehr gute Meinung über die CDU; 9=keine Angabe (Ordinalskala) [[Kategorie:SPSS-Kurs]] 771b33d80c0b4989920f436cd9f0c412e3c2640f Kategorie:SPSS-Kurs 14 8 13 2019-04-13T16:06:34Z Trg 1 Die Seite wurde neu angelegt: „==SPSS==“ wikitext text/x-wiki ==SPSS== 4ea8f4922d25f3651a6cdead948ae16ecd2dfa54 14 13 2019-04-13T16:07:23Z Trg 1 /* SPSS */ +Hinweis wikitext text/x-wiki ==SPSS== Der Wiederaufbau der Seiten wird einige Zeit dauern (2019-04-13). 742d7f5ed48d5faa3a86a2927a4dc6f969c41e53 Benutzer:Trg 2 9 16 2019-04-13T16:14:50Z Trg 1 Angelegt wikitext text/x-wiki Wer Informationen über den Autor, Webmaster und Betreiber dieser Seite sucht, wird hier gut bedient: [http://www.roessing.org|http://www.roessing.org] ce45d3258b61c07c9d74964ee5a1795b5d738f43 18 16 2019-04-13T16:17:32Z Trg 1 wikitext text/x-wiki Wer Informationen über den Autor, Webmaster und Betreiber dieser Seite sucht, wird hier gut bedient: [http://www.roessing.org http://www.roessing.org] 8ddedb4b95ccd3283b865c2ff232bea06fa5c882 Daten eingeben 0 10 19 2019-04-14T12:10:42Z Trg 1 Wiederherstellung wikitext text/x-wiki Während in der Variablenansicht die Variablen definiert werden, können nach Umschalten auf die Datenansicht die Werte für die einzelnen Fälle eingegeben werden. Im Kopf der Datentabelle stehen die Variablennamen, jede Zeile ist ein Fall. Die jeweils aktive Zelle wird durch einen etwas stärkeren Rahmen markiert. Bei fehlenden Werten steht ein Punkt oder ein Komma in der fraglichen Zeile (z.B. wenn jemand seine Parteineigung nicht angegeben hat, oder nicht alle Variablen bei allen Untersuchungsobjekten erhoben worden sind. Bei größeren Datensätzen müssen die Dateneingeber darauf achten bei der Dateneingabe weder in der Zeile, noch in der Spalte zu verrutschen. Für die Kontrolle der Spaltenposition kann man sich an Spalten mit optisch auffälligen Daten, im Beispiel etwa der Alter-Spalte, die zweistellige Werte enthält, orientieren. [[Kategorie:SPSS-Kurs]] 763c19ce1fb9aa9bf4697aab4a636e4bcd5263c5 Dateneingabe 0 11 20 2019-04-14T12:11:39Z Trg 1 erstellt wikitext text/x-wiki #REDIRECT [[Daten eingeben]] d92982fa6095c7ec6d1beee9a1e20eeddf1020b7 Dateien zusammenführen 0 12 21 2019-04-14T12:14:54Z Trg 1 Wiederherstellung wikitext text/x-wiki Es kann vorkommen, daß man mehrere SPSS-Datensätze miteinander verbinden muß. Das ist zum Beispiel dann der Fall, wenn mehrere Dateneingeber sich die Eingabe vieler Datensätze teilen. ==Fälle hinzufügen== Das entsprechende Menü findet sich unter Daten|Dateien zusammenfügen|Fälle hinzufügen... Hier wählt man eine Datei aus, die der bereits geöffneten Datendatei hinzugefügt werden soll. Nach dem Bestätigen des Befehls erscheint eine Übersicht in der man ggf. entscheiden muß, was mit nicht gepaarten Variablen (Variablen, die nur in einem der beiden Datensätze vorkommen) geschehen soll. Nicht gepaarte Variablen, die in beiden Datensätzen unter unterschiedlichem Namen vorkommen - also Variablen mit gleicher Definition, aber unterschiedlichen Namen - kann man paaren, indem man sie bei gedrückter Strg-Taste mit der Maus markiert und dann auf "Paar" klickt. Außerdem kann man ankreuzen, daß eine neue Variable angelegt werden soll, aus der hervorgeht, welche Daten im neuen Datensatz aus welchem Quelldatensatz stammen. Das kann nützlich sein, wenn man dies - z.B. für Zwecke der Datenbereinigung - später nachvollziehen will. ==Variablen hinzufügen== Man kann auch zusätzliche Variablen aus einem anderen Datensatz einfügen, dazu wählt man das Menü Daten|Dateien zusammenfügen|Variablen hinzufügen... ==Vorsichtsamaßnahmen== Das Zusammenfügen von Datendateien erfordert äußerste Sorgfalt, damit die Übersicht gewahrt bleibt und in den Daten kein Durcheinander entsteht. Die neuen Datensätze sollten so benannt werden, daß die Quelldatensätze nicht überschrieben werden; dann kann man fehlerhafte Zusammenführungen rückgängig machen. Durch Hinzufügen von Dateien, die bereits hinzugefügt wurden (z.B. durch jemand anderen oder durch Verwechslung), entstehen Doubletten, das sind doppelte Fälle, die - wenn überhaupt - oft nur mühsam von Hand aus einem Datensatz entfernt werden können. [[Kategorie:SPSS-Kurs]] 57f5278caf666ae19511694ecf7839fedf79656b Häufigkeitsauszählung 0 13 22 2019-04-14T12:18:36Z Trg 1 angelegt wikitext text/x-wiki Wenn man einen Datensatz eingegeben hat, sollte man zunächst eine einfache Häufigkeitsauszählung aller Variablen machen. Das hat erstens den Zweck, Eingabefehler zu finden (Datenbereinigung) und zweitens verschafft man sich so einen ersten Überblick über die Daten. Die Häufigkeitsauszählung erreicht man über das Menü Analysieren|Deskriptive Statistiken|Häufigkeiten... 0ddc39d45327d19da251223d829d384137118a10 26 22 2019-04-14T12:22:52Z Trg 1 +Bild wikitext text/x-wiki Wenn man einen Datensatz eingegeben hat, sollte man zunächst eine einfache Häufigkeitsauszählung aller Variablen machen. Das hat erstens den Zweck, Eingabefehler zu finden (Datenbereinigung) und zweitens verschafft man sich so einen ersten Überblick über die Daten. Die Häufigkeitsauszählung erreicht man über das Menü Analysieren|Deskriptive Statistiken|Häufigkeiten... [[Bild:Haeufigkeit1.jpg|left]] 809fb06ebc571e7e15a107c292c5b8b44b3bc667 27 26 2019-04-14T12:29:25Z Trg 1 erweitert wikitext text/x-wiki Wenn man einen Datensatz eingegeben hat, sollte man zunächst eine einfache Häufigkeitsauszählung aller Variablen machen. Das hat erstens den Zweck, Eingabefehler zu finden (Datenbereinigung) und zweitens verschafft man sich so einen ersten Überblick über die Daten. Die Häufigkeitsauszählung erreicht man über das Menü Analysieren|Deskriptive Statistiken|Häufigkeiten... [[Bild:Haeufigkeit1.jpg|left]] <br clear=all> Es erscheint das Häufigkeiten-Bedienfenster, in dem links die verfügbaren Variablen stehen. Aus dieser Liste kann man die Variablen, für die man eine Häufigkeitsauszählung erstellen lassen möchte, auswählen. Sie erscheinen dann im rechten Teil des Fensters. <br clear=all> [[Bild:Haeufigkeit2.jpg|left]] 20f9c8a037a7797748a8d6a36c88c076d274a484 28 27 2019-04-14T12:31:24Z Trg 1 erweitert wikitext text/x-wiki Wenn man einen Datensatz eingegeben hat, sollte man zunächst eine einfache Häufigkeitsauszählung aller Variablen machen. Das hat erstens den Zweck, Eingabefehler zu finden (Datenbereinigung) und zweitens verschafft man sich so einen ersten Überblick über die Daten. Die Häufigkeitsauszählung erreicht man über das Menü Analysieren|Deskriptive Statistiken|Häufigkeiten... [[Bild:Haeufigkeit1.jpg|left]] <br clear=all> Es erscheint das Häufigkeiten-Bedienfenster, in dem links die verfügbaren Variablen stehen. Aus dieser Liste kann man die Variablen, für die man eine Häufigkeitsauszählung erstellen lassen möchte, auswählen. Sie erscheinen dann im rechten Teil des Fensters. <br clear=all> [[Bild:Haeufigkeit2.jpg|left]] <br clear=all> Über den Button "Statistik..." kann eingestellt werden, welche Kennwerte ausgegeben werden sollen. Neben den Perzentilen sind die wichtigsten Angaben, die bei Analysen durch eine Häufigkeitsauszählung ermittelt werden: *Mittelwert (arithmetisches Mittel) *Median (Mitte der Wertreihe) *Modalwert (auch Modus genannt, der am häufigsten vorkommende Wert) *Summe *Standardabweichung (Mittelwert der Abweichung der Werte vom Gesamtmittelwert) *Varianz (quadrierte Standardabweichung) *Kurtosis ("Wölbung" einer Verteilung) *Schiefe (Rechts- oder Linkslastigkeit einer Verteilungskurve) Über den Button "Diagramme" kann man die Daten graphisch aufbereiten lassen. Besonders wichtig ist in dem Zusammenhang die Option "Historgramm, mit Normalverteilungskurve". Sie wird für Tests auf Normalverteilung gebraucht. ==Beispielausgabe== e05d9f2d3763025830276a2b0367ce4b6edce6c1 29 28 2019-04-14T12:34:22Z Trg 1 erweitert wikitext text/x-wiki Wenn man einen Datensatz eingegeben hat, sollte man zunächst eine einfache Häufigkeitsauszählung aller Variablen machen. Das hat erstens den Zweck, Eingabefehler zu finden (Datenbereinigung) und zweitens verschafft man sich so einen ersten Überblick über die Daten. Die Häufigkeitsauszählung erreicht man über das Menü Analysieren|Deskriptive Statistiken|Häufigkeiten... [[Bild:Haeufigkeit1.jpg|left]] <br clear=all> Es erscheint das Häufigkeiten-Bedienfenster, in dem links die verfügbaren Variablen stehen. Aus dieser Liste kann man die Variablen, für die man eine Häufigkeitsauszählung erstellen lassen möchte, auswählen. Sie erscheinen dann im rechten Teil des Fensters. <br clear=all> [[Bild:Haeufigkeit2.jpg|left]] <br clear=all> Über den Button "Statistik..." kann eingestellt werden, welche Kennwerte ausgegeben werden sollen. Neben den Perzentilen sind die wichtigsten Angaben, die bei Analysen durch eine Häufigkeitsauszählung ermittelt werden: *Mittelwert (arithmetisches Mittel) *Median (Mitte der Wertreihe) *Modalwert (auch Modus genannt, der am häufigsten vorkommende Wert) *Summe *Standardabweichung (Mittelwert der Abweichung der Werte vom Gesamtmittelwert) *Varianz (quadrierte Standardabweichung) *Kurtosis ("Wölbung" einer Verteilung) *Schiefe (Rechts- oder Linkslastigkeit einer Verteilungskurve) Über den Button "Diagramme" kann man die Daten graphisch aufbereiten lassen. Besonders wichtig ist in dem Zusammenhang die Option "Historgramm, mit Normalverteilungskurve". Sie wird für Tests auf Normalverteilung gebraucht. ==Beispielausgabe== Die Häufigkeitsauszählung für den kleinen Beispieldatensatz (10 Fälle), mit dem die Screenshots erstellt wurden, sieht (bei eingeschalteter Anzeige von Mittelwert und Modalwert folgendermaßen aus (Ausschnitt): <br clear=all> [[Bild:Haeufigkeit3.jpg|left]] <br clear=all> In der ersten Tabelle ("Statistiken") werden die angeforderten Werte Mittelwert und Modalwert für alle untersuchten Variablen dargestellt. Darunter wird für jede Variable eine Häufigkeitstabelle angelegt. Sie enthält folgende Angaben (Spalten von links nach rechts): *Ausprägungen der Variablen; wenn Wertelabels vorhanden sind, werden diese Labels angezeigt. *Häufigkeit in absoluten Zahlen. Das Beispiel enthält beispielsweise fünf männliche und fünf weibliche Fälle. *Häufigkeit in Prozent, bezogen auf den Gesamtdatensatz. Wenn ein Datensatz "Missings" (fehlende Werte für eine Variable) enthält, werden diese mit zur Basis der Prozentuierung gezählt. Wenn für die gezählte Variable keine fehlenden Werte vorliegen, sind "Prozent" und "gültige Prozent" identisch (wie hier im Beispiel). *Häufigkeit in gültigen Prozentwerten, bezogen nur auf gültige Werte für diese Variable (Missings werden nicht mitgezählt) *Kumulierte Prozente, die Prozentwerte der einzelnen Ausprägungen der Variablen werden addiert. [[Kategorie:SPSS-Kurs]] a416dc04b61fce2c72eee338308f8d59ef2424ab 30 29 2019-04-14T12:34:51Z Trg 1 /* Beispielausgabe */ wikitext text/x-wiki Wenn man einen Datensatz eingegeben hat, sollte man zunächst eine einfache Häufigkeitsauszählung aller Variablen machen. Das hat erstens den Zweck, Eingabefehler zu finden (Datenbereinigung) und zweitens verschafft man sich so einen ersten Überblick über die Daten. Die Häufigkeitsauszählung erreicht man über das Menü Analysieren|Deskriptive Statistiken|Häufigkeiten... [[Bild:Haeufigkeit1.jpg|left]] <br clear=all> Es erscheint das Häufigkeiten-Bedienfenster, in dem links die verfügbaren Variablen stehen. Aus dieser Liste kann man die Variablen, für die man eine Häufigkeitsauszählung erstellen lassen möchte, auswählen. Sie erscheinen dann im rechten Teil des Fensters. <br clear=all> [[Bild:Haeufigkeit2.jpg|left]] <br clear=all> Über den Button "Statistik..." kann eingestellt werden, welche Kennwerte ausgegeben werden sollen. Neben den Perzentilen sind die wichtigsten Angaben, die bei Analysen durch eine Häufigkeitsauszählung ermittelt werden: *Mittelwert (arithmetisches Mittel) *Median (Mitte der Wertreihe) *Modalwert (auch Modus genannt, der am häufigsten vorkommende Wert) *Summe *Standardabweichung (Mittelwert der Abweichung der Werte vom Gesamtmittelwert) *Varianz (quadrierte Standardabweichung) *Kurtosis ("Wölbung" einer Verteilung) *Schiefe (Rechts- oder Linkslastigkeit einer Verteilungskurve) Über den Button "Diagramme" kann man die Daten graphisch aufbereiten lassen. Besonders wichtig ist in dem Zusammenhang die Option "Historgramm, mit Normalverteilungskurve". Sie wird für Tests auf Normalverteilung gebraucht. ==Beispielausgabe== Die Häufigkeitsauszählung für den kleinen Beispieldatensatz (10 Fälle), mit dem die Screenshots erstellt wurden, sieht (bei eingeschalteter Anzeige von Mittelwert und Modalwert folgendermaßen aus (Ausschnitt): <br clear=all> [[Bild:Haeufigkeit3.jpg|left|frame]] <br clear=all> In der ersten Tabelle ("Statistiken") werden die angeforderten Werte Mittelwert und Modalwert für alle untersuchten Variablen dargestellt. Darunter wird für jede Variable eine Häufigkeitstabelle angelegt. Sie enthält folgende Angaben (Spalten von links nach rechts): *Ausprägungen der Variablen; wenn Wertelabels vorhanden sind, werden diese Labels angezeigt. *Häufigkeit in absoluten Zahlen. Das Beispiel enthält beispielsweise fünf männliche und fünf weibliche Fälle. *Häufigkeit in Prozent, bezogen auf den Gesamtdatensatz. Wenn ein Datensatz "Missings" (fehlende Werte für eine Variable) enthält, werden diese mit zur Basis der Prozentuierung gezählt. Wenn für die gezählte Variable keine fehlenden Werte vorliegen, sind "Prozent" und "gültige Prozent" identisch (wie hier im Beispiel). *Häufigkeit in gültigen Prozentwerten, bezogen nur auf gültige Werte für diese Variable (Missings werden nicht mitgezählt) *Kumulierte Prozente, die Prozentwerte der einzelnen Ausprägungen der Variablen werden addiert. [[Kategorie:SPSS-Kurs]] 236774a9e705a44627746e327f89fa9f30b651d6 Datei:Haeufigkeit1.jpg 6 14 23 2019-04-14T12:19:14Z Trg 1 wikitext text/x-wiki da39a3ee5e6b4b0d3255bfef95601890afd80709 Datei:Haeufigkeit2.jpg 6 15 24 2019-04-14T12:19:30Z Trg 1 wikitext text/x-wiki da39a3ee5e6b4b0d3255bfef95601890afd80709 Datei:Haeufigkeit3.jpg 6 16 25 2019-04-14T12:19:48Z Trg 1 wikitext text/x-wiki da39a3ee5e6b4b0d3255bfef95601890afd80709 Datenbereinigung 0 17 31 2019-04-14T12:37:31Z Trg 1 Wiederherstellung wikitext text/x-wiki Unter '''Datenbereinigung''' versteht man das Entfernen von Fehlern aus SPSS-Datensätzen. ==Fehler und Ursachen== Fehler können an drei Stellen im Datenverarbeitungsprozeß entstehen: *Bei der Datenerhebung: Ein Befragter kreuzt beispielsweise etwas Falsches an oder ein Codierer bei der Inhaltsanalyse irrt sich beim Verschlüsseln eines Textes. *Bei der Dateneingabe: Tippfehler, Verrutschen in Zeile oder Spalte, Zahlendreher. *Bei der Datenaufbereitung, z.B. durch Fehler beim Recodieren von Variablen oder beim Berechnen von Indizes. e61ad0a5b379696c35475f747a8a8d0c36a37386 32 31 2019-04-14T12:40:15Z Trg 1 erweitert wikitext text/x-wiki Unter '''Datenbereinigung''' versteht man das Entfernen von Fehlern aus SPSS-Datensätzen. ==Fehler und Ursachen== Fehler können an drei Stellen im Datenverarbeitungsprozeß entstehen: *Bei der Datenerhebung: Ein Befragter kreuzt beispielsweise etwas Falsches an oder ein Codierer bei der Inhaltsanalyse irrt sich beim Verschlüsseln eines Textes. *Bei der Dateneingabe: Tippfehler, Verrutschen in Zeile oder Spalte, Zahlendreher. *Bei der Datenaufbereitung, z.B. durch Fehler beim Recodieren von Variablen oder beim Berechnen von Indizes. ==Praxis der Datenbereinigung== Die Datenbereinigung wird in der Regel ''einmal'' nach Abschluß der Dateneingabe durchgeführt, bevor mit Analysen begonnen wird. Dabei werden zwei Strategien kombiniert angewandt: #Durchsicht einer vollständigen Häufigkeitsauszählung auf falsche Werte (wenn z.B. bei einer fünfteiligen Skala '79' eingetragen ist). #Suche nach unlogischen oder unvollständigen Angaben: ##Wenn bei einer Inhaltsanalyse für einen Politiker drei Artikelmerkmale erhoben werden müssen, müssen diese Merkmale ebenso oft verschlüsselt worden sein, wie das Vorkommen des Politikers. Das heißt: Wenn für Angela Merkel die Merkmale Kompetenz, Sympathie und Vertrauenswürdigkeit erhoben wurden und Angela Merkel in 889 Beiträgen vorkam, muß es auch je 889 Verschlüsselungen für die drei Merkmale geben. Wurde Kompetenz 891 mal verschlüsselt und Vertrauenswürdigkeit nur 888 mal, stimmt etwas nicht. ##Wenn nur Befragte, die ein Automobil besitzen, nach ihren Tankgewohnheiten gefragt werden sollen, sind alle Einträge zu den Tankgewohnheiten bei Nicht-Autobesitzern falsch. Die Vorgehensweise bei der Suche nach unvollständigen oder unlogischen Daten ist das wiederholte Gegenrechnen der Variablen mit Kreuztabellen bei gleichzeitiger Anwendung von [[Fälle auswählen]]. Für das Auffinden bekannter Fehler im Datensatz ist die Funktion "Fälle sortieren" sehr hilfreich. Diese Analysen müssen wiederholt werden, bis kein Fehler mehr entdeckt wird, weil sich bei der Bereinigung eines Fehlers manchmal ein neuer einschleicht (Beispiel: Alle Werte im obigen Merkel-Beispiel werden im Zuge der Datenbereinigung auf 889 Fälle vereinheitlicht und dann stellt sich bei einem weiteren Bereinigungsschritt heraus, daß nur 887 mal das Vorkommen einer CDU-Politikerin verschlüsselt wurde). a801f6bb7cb719d9b39c3ca45482da6d6cdbf158 33 32 2019-04-14T12:40:48Z Trg 1 +Kat wikitext text/x-wiki Unter '''Datenbereinigung''' versteht man das Entfernen von Fehlern aus SPSS-Datensätzen. ==Fehler und Ursachen== Fehler können an drei Stellen im Datenverarbeitungsprozeß entstehen: *Bei der Datenerhebung: Ein Befragter kreuzt beispielsweise etwas Falsches an oder ein Codierer bei der Inhaltsanalyse irrt sich beim Verschlüsseln eines Textes. *Bei der Dateneingabe: Tippfehler, Verrutschen in Zeile oder Spalte, Zahlendreher. *Bei der Datenaufbereitung, z.B. durch Fehler beim Recodieren von Variablen oder beim Berechnen von Indizes. ==Praxis der Datenbereinigung== Die Datenbereinigung wird in der Regel ''einmal'' nach Abschluß der Dateneingabe durchgeführt, bevor mit Analysen begonnen wird. Dabei werden zwei Strategien kombiniert angewandt: #Durchsicht einer vollständigen Häufigkeitsauszählung auf falsche Werte (wenn z.B. bei einer fünfteiligen Skala '79' eingetragen ist). #Suche nach unlogischen oder unvollständigen Angaben: ##Wenn bei einer Inhaltsanalyse für einen Politiker drei Artikelmerkmale erhoben werden müssen, müssen diese Merkmale ebenso oft verschlüsselt worden sein, wie das Vorkommen des Politikers. Das heißt: Wenn für Angela Merkel die Merkmale Kompetenz, Sympathie und Vertrauenswürdigkeit erhoben wurden und Angela Merkel in 889 Beiträgen vorkam, muß es auch je 889 Verschlüsselungen für die drei Merkmale geben. Wurde Kompetenz 891 mal verschlüsselt und Vertrauenswürdigkeit nur 888 mal, stimmt etwas nicht. ##Wenn nur Befragte, die ein Automobil besitzen, nach ihren Tankgewohnheiten gefragt werden sollen, sind alle Einträge zu den Tankgewohnheiten bei Nicht-Autobesitzern falsch. Die Vorgehensweise bei der Suche nach unvollständigen oder unlogischen Daten ist das wiederholte Gegenrechnen der Variablen mit Kreuztabellen bei gleichzeitiger Anwendung von [[Fälle auswählen]]. Für das Auffinden bekannter Fehler im Datensatz ist die Funktion "Fälle sortieren" sehr hilfreich. Diese Analysen müssen wiederholt werden, bis kein Fehler mehr entdeckt wird, weil sich bei der Bereinigung eines Fehlers manchmal ein neuer einschleicht (Beispiel: Alle Werte im obigen Merkel-Beispiel werden im Zuge der Datenbereinigung auf 889 Fälle vereinheitlicht und dann stellt sich bei einem weiteren Bereinigungsschritt heraus, daß nur 887 mal das Vorkommen einer CDU-Politikerin verschlüsselt wurde). [[Kategorie:SPSS-Kurs]] bc73ca9714f3dc41ce6ab43b82d678d164858d0a Perzentile 0 18 34 2019-04-14T12:45:46Z Trg 1 Wiederherstellung wikitext text/x-wiki '''Perzentile''' (können bei der Berechnung von [[Häufigkeitsauszählung]]en unter "Optionen" angefordert werden) sind Lagemaße für eine Verteilung von Objekten. Dazu werden die Objekte, z.B. befragte Personen, nach der Ausprägung einer Variablen (z.B. dem Alter) geordnet. In dem Beispieldatensatz, mit dem die Screenshots erstellt wurden, gibt es eine Variable "Alter". Für die folgenden Beispiele der Perzentilberechnungen müssen die "Befragten" zunächst nach dem interessierenden Merkmal "Alter" sortiert werden (in Wirklichkeit macht SPSS das automatisch im Hintergrund, das Verfahren wird hier lediglich zur Illustration genau erklärt). 20; 20; 21; 21; 22; 22; 22; 22; 22; 22; 22; 23; 23; 24; 26; 26; 29; 29; 31; 31 2af78b9759151a88385790d353ce589134498c4b 35 34 2019-04-14T12:49:34Z Trg 1 Wiederherstellung wikitext text/x-wiki '''Perzentile''' (können bei der Berechnung von [[Häufigkeitsauszählung]]en unter "Optionen" angefordert werden) sind Lagemaße für eine Verteilung von Objekten. Dazu werden die Objekte, z.B. befragte Personen, nach der Ausprägung einer Variablen (z.B. dem Alter) geordnet. In dem Beispieldatensatz, mit dem die Screenshots erstellt wurden, gibt es eine Variable "Alter". Für die folgenden Beispiele der Perzentilberechnungen müssen die "Befragten" zunächst nach dem interessierenden Merkmal "Alter" sortiert werden (in Wirklichkeit macht SPSS das automatisch im Hintergrund, das Verfahren wird hier lediglich zur Illustration genau erklärt). 20; 20; 21; 21; 22; 22; 22; 22; 22; 22; 22; 23; 23; 24; 26; 26; 29; 29; 31; 31 ==Median== Der Median wird meist als Lagemaß im Zusammenhang mit dem Mittelwert genannt, ist aber eigentlich nur ein spezieller Perzentilwert. Er gibt an, welcher Wert sich in der Mitte der geordneten Wertereihe befindet. Im Beispiel oben ist das die 22 (links und rechts der Mitte steht 22 als Altersangabe). ==Quartile== Der Median wird meist als Lagemaß im Zusammenhang mit dem Mittelwert genannt, ist aber eigentlich nur ein spezieller Perzentilwert. Er gibt an, welcher Wert sich in der Mitte der geordneten Wertereihe befindet. Im Beispiel oben ist das die 22 (links und rechts der Mitte steht 22 als Altersangabe). ==Dezile== SPSS berechnet auch andere Werte, beispielsweise den Perzentilwert für 90 Prozent der geordneten Wertereihe. Er beträgt hier 30,8 (siehe Abbildung) und kann nicht mehr anschaulich aus der Reihe abgeleitet werden, hier muß der Nutzer sich auf die Ausgabe von SPSS verlassen. ==Weblinks== *Median bei de.wikipedia.org https://de.wikipedia.org/wiki/Median [[Kategorie:SPSS-Kurs]] 41ff0e4dd79ce873e63d85ad89859e3710f87ce7 Median 0 19 36 2019-04-14T12:50:17Z Trg 1 Angelegt wikitext text/x-wiki #REDIRECT [[Perzentile]] f0740d4b1ee2e2b6dd328f47508751a0eaa61c87 Recodieren 0 20 37 2019-04-14T12:55:46Z Trg 1 Wiederherstellung wikitext text/x-wiki Unter Recodieren versteht man das Umcodieren von Werten in Variablen. Dabei werden bestimmten Werten im Datensatz neue Werte zugewiesen, z.B. um Werte zusammenzufassen oder fehlerhafte Werte zu korrigieren. Die beiden Menüeinträge für "Umkodieren", "In dieselben Variablen..." und "In andere Variablen..." befinden sich im Menü "Transformieren". ==Recodieren in dieselben Variablen== Beim Recodieren in dieselben Variablen werden die Werte innerhalb einer Variablen verändert. Diese Änderungen können in einem Datensatz nicht rückgängig gemacht werden. '''Gefahr!''' Das Recodieren in dieselben Variablen wird für Auswertungs- und Umformungszwecke niemals eingesetzt. Es kann ja sein, daß man irgendwann auf die Originaldaten zurückgreifen muß, um eine andere Art der Transformation durchzuführen. Bei der Datenbereinigung kann das Recodieren in dieselben Variablen nützlich sein, um eine große Zahl falscher Werte auf einmal zu korrigieren. '''Wegen möglicher Fehler darf das Verfahren aber auch dann nur angewandt werden, wenn eine Sicherungskopie des Datensatzes vorhanden ist!''' Hinsichtlich der Bedienung des Programms funktioniert das Recodieren in dieselben Variablen genau so wie das im nächsten Abschnitt besprochene Recodieren in andere Variablen. ==Recodieren in andere Variablen== Beim Recodieren in andere Variablen werden die alten Werte in neue Werte in einer neuen Variablen umgesetzt. Bei einer großen Zahl von Recodierungen wird ein Datensatz dadurch möglicherweise sehr groß. Man sollte sich deshalb genau aufschreiben, welche Recodierungen man unter welchen Bedingungen vorgenommen hat und die neu entstandenen Variablen sorgfältig definieren und labeln. ===Variablen auswählen und neue Variablen benennen=== Zuerst wählt man die Variable oder die Variablen, die man recodieren möchte, aus. In dem Beispieldatensatz für diese Darstellung sollen die Variablen SPDMNG und CDUMNG, die in fünfteiligen Skalen die Meinung zu den beiden Parteien von 1 := "sehr schlecht" bis 5 := "sehr gut" erfassen, zu dreistufigen Skalen zusammengefaßt werden. Nachdem die Variablen ausgewählt wurden, muß ganz rechts im Fenster einen Namen für die jeweilige Zielvariable und ein Label für diese Variable ausgewählt werden. Sowohl aus dem Namen, als auch aus dem Label sollte ersichtlich sein, daß die Variable recodiert wurde. ===Alte und neue Werte=== 6297dbc61655a423bef0dfcf859fb3be2646e335 38 37 2019-04-14T12:57:44Z Trg 1 erweitert wikitext text/x-wiki Unter Recodieren versteht man das Umcodieren von Werten in Variablen. Dabei werden bestimmten Werten im Datensatz neue Werte zugewiesen, z.B. um Werte zusammenzufassen oder fehlerhafte Werte zu korrigieren. Die beiden Menüeinträge für "Umkodieren", "In dieselben Variablen..." und "In andere Variablen..." befinden sich im Menü "Transformieren". ==Recodieren in dieselben Variablen== Beim Recodieren in dieselben Variablen werden die Werte innerhalb einer Variablen verändert. Diese Änderungen können in einem Datensatz nicht rückgängig gemacht werden. '''Gefahr!''' Das Recodieren in dieselben Variablen wird für Auswertungs- und Umformungszwecke niemals eingesetzt. Es kann ja sein, daß man irgendwann auf die Originaldaten zurückgreifen muß, um eine andere Art der Transformation durchzuführen. Bei der Datenbereinigung kann das Recodieren in dieselben Variablen nützlich sein, um eine große Zahl falscher Werte auf einmal zu korrigieren. '''Wegen möglicher Fehler darf das Verfahren aber auch dann nur angewandt werden, wenn eine Sicherungskopie des Datensatzes vorhanden ist!''' Hinsichtlich der Bedienung des Programms funktioniert das Recodieren in dieselben Variablen genau so wie das im nächsten Abschnitt besprochene Recodieren in andere Variablen. ==Recodieren in andere Variablen== Beim Recodieren in andere Variablen werden die alten Werte in neue Werte in einer neuen Variablen umgesetzt. Bei einer großen Zahl von Recodierungen wird ein Datensatz dadurch möglicherweise sehr groß. Man sollte sich deshalb genau aufschreiben, welche Recodierungen man unter welchen Bedingungen vorgenommen hat und die neu entstandenen Variablen sorgfältig definieren und labeln. ===Variablen auswählen und neue Variablen benennen=== Zuerst wählt man die Variable oder die Variablen, die man recodieren möchte, aus. In dem Beispieldatensatz für diese Darstellung sollen die Variablen SPDMNG und CDUMNG, die in fünfteiligen Skalen die Meinung zu den beiden Parteien von 1 := "sehr schlecht" bis 5 := "sehr gut" erfassen, zu dreistufigen Skalen zusammengefaßt werden. Nachdem die Variablen ausgewählt wurden, muß ganz rechts im Fenster einen Namen für die jeweilige Zielvariable und ein Label für diese Variable ausgewählt werden. Sowohl aus dem Namen, als auch aus dem Label sollte ersichtlich sein, daß die Variable recodiert wurde. ===Alte und neue Werte=== Auf der Seite der Quellvariablen kann man folgende Optionen auswählen: *Wert. Ein einzelner Wert, z.B. die 3 aus dem Beispiel, die zur 0 werden soll. *Systemdefiniert fehlend. Hiermit können Missings in Zahlen umgewandelt werden, z.B. in die 9 oder die 99, die bei Inhaltsanalysen und Umfragen oft bedeuten "keine Angabe". *System- oder benutzerdefiniert fehlende Werte. Wie der Punkt zuvor, aber einschließlich benutzerdefiniert fehlender Werte. *Bereich. Mehrere nebeneinanderliegende Werte, z.B. 1 und 2 oder 1 bis 5. *Bereich: kleinster Wert bis... *Bereich: größter Wert bis... *Alle anderen Werte. Diesen Eintrag schreibt man oft als letzten in die Liste der Transformationen und wählt auf der rechten Seite "Alte Werte kopieren". Der Eintrag lautet dann "else -> copy", damit wird sichergestellt, daß alle Werte, die nicht umkodiert werden sollen, in die neuen Variablen unverändert übernommen werden. Man kann sie aber genau so gut alle auf einen bestimmten Wert setzen oder in "systemdefiniert fehlend" ("missing") umwandeln, wenn man einen Teil der Werte nicht mehr braucht. Auf der Seite der Zielvariablen kann man auswählen: *Wert. Konkreter Wert, z.B. -1. *Systemdefiniert fehlend. Missing. *Alte Werte übernehmen. Keine Veränderung. Es empfiehlt sich, die Liste der Änderungen, die man hinzugefügt hat, nochmals aufmerksam zu überprüfen, bevor man "Weiter" klickt. Ein Tippfehler kann beim Recodieren dramatische Folgen haben! c1e8d968534dea0618e78760c8189c75d98da73d 39 38 2019-04-14T12:59:48Z Trg 1 erweitert wikitext text/x-wiki Unter Recodieren versteht man das Umcodieren von Werten in Variablen. Dabei werden bestimmten Werten im Datensatz neue Werte zugewiesen, z.B. um Werte zusammenzufassen oder fehlerhafte Werte zu korrigieren. Die beiden Menüeinträge für "Umkodieren", "In dieselben Variablen..." und "In andere Variablen..." befinden sich im Menü "Transformieren". ==Recodieren in dieselben Variablen== Beim Recodieren in dieselben Variablen werden die Werte innerhalb einer Variablen verändert. Diese Änderungen können in einem Datensatz nicht rückgängig gemacht werden. '''Gefahr!''' Das Recodieren in dieselben Variablen wird für Auswertungs- und Umformungszwecke niemals eingesetzt. Es kann ja sein, daß man irgendwann auf die Originaldaten zurückgreifen muß, um eine andere Art der Transformation durchzuführen. Bei der Datenbereinigung kann das Recodieren in dieselben Variablen nützlich sein, um eine große Zahl falscher Werte auf einmal zu korrigieren. '''Wegen möglicher Fehler darf das Verfahren aber auch dann nur angewandt werden, wenn eine Sicherungskopie des Datensatzes vorhanden ist!''' Hinsichtlich der Bedienung des Programms funktioniert das Recodieren in dieselben Variablen genau so wie das im nächsten Abschnitt besprochene Recodieren in andere Variablen. ==Recodieren in andere Variablen== Beim Recodieren in andere Variablen werden die alten Werte in neue Werte in einer neuen Variablen umgesetzt. Bei einer großen Zahl von Recodierungen wird ein Datensatz dadurch möglicherweise sehr groß. Man sollte sich deshalb genau aufschreiben, welche Recodierungen man unter welchen Bedingungen vorgenommen hat und die neu entstandenen Variablen sorgfältig definieren und labeln. ===Variablen auswählen und neue Variablen benennen=== Zuerst wählt man die Variable oder die Variablen, die man recodieren möchte, aus. In dem Beispieldatensatz für diese Darstellung sollen die Variablen SPDMNG und CDUMNG, die in fünfteiligen Skalen die Meinung zu den beiden Parteien von 1 := "sehr schlecht" bis 5 := "sehr gut" erfassen, zu dreistufigen Skalen zusammengefaßt werden. Nachdem die Variablen ausgewählt wurden, muß ganz rechts im Fenster einen Namen für die jeweilige Zielvariable und ein Label für diese Variable ausgewählt werden. Sowohl aus dem Namen, als auch aus dem Label sollte ersichtlich sein, daß die Variable recodiert wurde. ===Alte und neue Werte=== Auf der Seite der Quellvariablen kann man folgende Optionen auswählen: *Wert. Ein einzelner Wert, z.B. die 3 aus dem Beispiel, die zur 0 werden soll. *Systemdefiniert fehlend. Hiermit können Missings in Zahlen umgewandelt werden, z.B. in die 9 oder die 99, die bei Inhaltsanalysen und Umfragen oft bedeuten "keine Angabe". *System- oder benutzerdefiniert fehlende Werte. Wie der Punkt zuvor, aber einschließlich benutzerdefiniert fehlender Werte. *Bereich. Mehrere nebeneinanderliegende Werte, z.B. 1 und 2 oder 1 bis 5. *Bereich: kleinster Wert bis... *Bereich: größter Wert bis... *Alle anderen Werte. Diesen Eintrag schreibt man oft als letzten in die Liste der Transformationen und wählt auf der rechten Seite "Alte Werte kopieren". Der Eintrag lautet dann "else -> copy", damit wird sichergestellt, daß alle Werte, die nicht umkodiert werden sollen, in die neuen Variablen unverändert übernommen werden. Man kann sie aber genau so gut alle auf einen bestimmten Wert setzen oder in "systemdefiniert fehlend" ("missing") umwandeln, wenn man einen Teil der Werte nicht mehr braucht. Auf der Seite der Zielvariablen kann man auswählen: *Wert. Konkreter Wert, z.B. -1. *Systemdefiniert fehlend. Missing. *Alte Werte übernehmen. Keine Veränderung. Es empfiehlt sich, die Liste der Änderungen, die man hinzugefügt hat, nochmals aufmerksam zu überprüfen, bevor man "Weiter" klickt. Ein Tippfehler kann beim Recodieren dramatische Folgen haben! ===Bedingtes Recodieren=== Wenn die alten und die neuen Werte festgelegt sind, können noch Bedingungen festgelegt werden, unter denen die Recodierung durchgeführt werden soll. Dafür können alle Variablen und dieselben Rechenoperationen verwendet werden, wie beim Fälle auswählen. Die Funktion wird benötigt, wenn Recodierungen z.B. nur für eine bestimmte Gruppe bei einem Experiment oder für einen bestimmten Zeitraum bei einer Inhaltsanalyse vorgenommen werden sollen. ==Nach dem Recodieren== Nach dem Recodieren sollte das Ergebnis mit einer Häufigkeitsauszählung, ggf. auch durch einen Vergleich von Vorher- und Nachher-Ergebnissen überprüft werden. Beim Recodieren in neue Variablen müssen außerdem die Eigenschaften der Variablen, angefangen von der Spaltenbreite und der Zahl der Dezimalstellen, bis zu den Labels und den fehlenden Werten richtig eingestellt werden. [[Kategorie:SPSS-Kurs]] c254bae985f5bc742954368b394415165c9e7d2a Rekodieren 0 21 40 2019-04-14T13:09:43Z Trg 1 Red. wikitext text/x-wiki #REDIRECT [[Recodieren]] d8061d10f5f3ab6ac94efbc7d95bd41153a4149f Umkodieren 0 22 41 2019-04-14T13:10:21Z Trg 1 Red. wikitext text/x-wiki #REDIRECT [[Recodieren]] d8061d10f5f3ab6ac94efbc7d95bd41153a4149f Berechnen 0 23 42 2019-04-14T13:13:44Z Trg 1 Wiederherstellung wikitext text/x-wiki Die Funktion "Berechnen..." erreicht man über den ersten Eintrag im Menü "Transformieren". "Berechnen" wird verwendet, um aus den Werten einer oder mehrerer Variablen einen Wert für eine neue Variable zu berechnen. Die Funktion wird benötigt, um Indizes (Singular: Index) zu berechnen oder Variablen für Analysen zusammenzufassen, wenn Mehrfachantworten nicht geeignet sind. ==Das Berechnungs-Menü== Das Berechnungs-Menü enthält links eine Liste der verfügbaren Variablen. Darüber ist ein Feld für den Namen der Variable, in die das Ergebnis der Berechnung geschrieben werden soll. Rechts daneben ist das Feld, in das die Berechnungsvorschrift eingetragen wird. Darunter befindet sich die schon vom Fälle auswählen bekannte Tastatur zur Eingabe von Operatoren. Rechts sind Auswahlfelder für statistische und mathematische Funktionen. Im unteren Bereich des Fensters kann man, genau wie beim Recodieren, Bedingungen angeben, bei deren Vorliegen die Berechnung ausgeführt werden soll. ==Beispiel: Saldo== Für das Beispiel wurden die Variablen zur SPD-Meinung und CDU-Meinung der "Befragten" des Beispieldatensatzes so [[Recodieren|recodiert]], daß die Werte 1 und 2 (schlecht) zu -1, die Werte 4 und 5 (gut) zu +1 und die Mitte, die 3, zur 0 werden. Unter einem Saldo versteht man die Differenz zwischen positiven und negativen Bewertungen (wird häufig bei Inhaltsanalysen verwendet, um z.B. die Gesamttendenz eines Beitrages oder einer Sendung zu berechnen). Durch die Transformation von negativen Bewertungen in negative Zahlen und den Nullwert der neutralen Bewertung müssen die recodierten Variablen spdmngre und cdumngre nur noch addiert werden. Die neue Variable, in die das Ergebnis geschrieben wird, wird einfach "saldo" genannt (es ist immer praktisch, wenn Variablen "sprechende" Namen haben). Nach einem Klick auf OK werden für jeden Fall die recodierten Werte für CDU und SPD addiert und in die Variable saldo geschrieben. Wie beim Recodieren müssen neu berechnete Variablen zunächst in der Variablenansicht mit brauchbaren Eigenschaften versehen werden. Wenn negative Werte auftreten können, ist es wichtig auch bei einstelligen Variablen das Spaltenformat mit zwei Stellen anzugeben, weil eine für das Minuszeichen benötigt wird. Besonders wichtig sind die Variablen- und die Wertelabel, damit man später weiß, welche Berechnung zu der neuen Variable geführt hat und was die berechneten Werte bedeuten. Die Interpretation von Saldi kann durchaus anspruchsvoll sein. Im vorliegenden Fall könnte man die Summe der Meinungen zu SPD und CDU als Meinung über die Große Koalition interpretieren. -2 und +2 würden beispielsweise Ablehnung bzw. Zustimmung zu beiden Parteien und damit vermutlich auch zur Koalition bedeuten. Eine Häufigkeitsauszählung der neuen Variable gibt Auskunft darüber, wie beide Parteien insgesamt bewertet werden. 9b5fa01a0da173d7178c302fb5d8c803a91fbcec 43 42 2019-04-14T13:14:52Z Trg 1 erweitert wikitext text/x-wiki Die Funktion "Berechnen..." erreicht man über den ersten Eintrag im Menü "Transformieren". "Berechnen" wird verwendet, um aus den Werten einer oder mehrerer Variablen einen Wert für eine neue Variable zu berechnen. Die Funktion wird benötigt, um Indizes (Singular: Index) zu berechnen oder Variablen für Analysen zusammenzufassen, wenn Mehrfachantworten nicht geeignet sind. ==Das Berechnungs-Menü== Das Berechnungs-Menü enthält links eine Liste der verfügbaren Variablen. Darüber ist ein Feld für den Namen der Variable, in die das Ergebnis der Berechnung geschrieben werden soll. Rechts daneben ist das Feld, in das die Berechnungsvorschrift eingetragen wird. Darunter befindet sich die schon vom Fälle auswählen bekannte Tastatur zur Eingabe von Operatoren. Rechts sind Auswahlfelder für statistische und mathematische Funktionen. Im unteren Bereich des Fensters kann man, genau wie beim Recodieren, Bedingungen angeben, bei deren Vorliegen die Berechnung ausgeführt werden soll. ==Beispiel: Saldo== Für das Beispiel wurden die Variablen zur SPD-Meinung und CDU-Meinung der "Befragten" des Beispieldatensatzes so [[Recodieren|recodiert]], daß die Werte 1 und 2 (schlecht) zu -1, die Werte 4 und 5 (gut) zu +1 und die Mitte, die 3, zur 0 werden. Unter einem Saldo versteht man die Differenz zwischen positiven und negativen Bewertungen (wird häufig bei Inhaltsanalysen verwendet, um z.B. die Gesamttendenz eines Beitrages oder einer Sendung zu berechnen). Durch die Transformation von negativen Bewertungen in negative Zahlen und den Nullwert der neutralen Bewertung müssen die recodierten Variablen spdmngre und cdumngre nur noch addiert werden. Die neue Variable, in die das Ergebnis geschrieben wird, wird einfach "saldo" genannt (es ist immer praktisch, wenn Variablen "sprechende" Namen haben). Nach einem Klick auf OK werden für jeden Fall die recodierten Werte für CDU und SPD addiert und in die Variable saldo geschrieben. Wie beim Recodieren müssen neu berechnete Variablen zunächst in der Variablenansicht mit brauchbaren Eigenschaften versehen werden. Wenn negative Werte auftreten können, ist es wichtig auch bei einstelligen Variablen das Spaltenformat mit zwei Stellen anzugeben, weil eine für das Minuszeichen benötigt wird. Besonders wichtig sind die Variablen- und die Wertelabel, damit man später weiß, welche Berechnung zu der neuen Variable geführt hat und was die berechneten Werte bedeuten. Die Interpretation von Saldi kann durchaus anspruchsvoll sein. Im vorliegenden Fall könnte man die Summe der Meinungen zu SPD und CDU als Meinung über die Große Koalition interpretieren. -2 und +2 würden beispielsweise Ablehnung bzw. Zustimmung zu beiden Parteien und damit vermutlich auch zur Koalition bedeuten. Eine Häufigkeitsauszählung der neuen Variable gibt Auskunft darüber, wie beide Parteien insgesamt bewertet werden. ==Beispiel: Index== Ein weiteres Beispiel für den Nutzen der Funktion "Berechnen..." sind multiplikative oder additive Indices. Beispielsweise kann man jedem Befragten, der ein bestimmtes Item auswählt, einen oder zwei Punkte dafür geben. Dann kann man für jeden Befragten die Gesamtpunktzahl durch Addition ermitteln. Handelt es sich bei Nichtvorliegen eines bestimmten Items um ein "Totschlagkriterium", so wählt man einen multiplikativen Index: Der Indexwert wird Null, sofern einer der Ausgangswerte 0 ist. Derartige Indizes kann man beispielsweise verwenden, wenn die Eignung von Bewerbern überprüft werden soll. Hat ein Bewerber eine bestimmte Qualifikation nicht, wird die dafür stehende Null mit allen anderen Werten multipliziert, das Produkt wird Null und der Bewerber scheidet aus. Indices können freilich auch durch wesentlich kompliziertere Berechnungen als Addition und Multiplikation erzeugt werden. Die Vorgehensweise ist dann jedoch stark von den Gegebenheiten und Anforderungen des konkreten Projekts abhängig. [[Kategorie:SPSS-Kurs]] 83644044fe48a689df75f6c8d6e5bc250084b1dc Kreuztabellen 0 24 44 2019-04-14T13:26:09Z Trg 1 Wiederherstellung wikitext text/x-wiki Kreuztabellen geben bei der Analyse eines Datensatzes Auskunft über Zusammenhänge zwischen Variablen. Manchmal wird die Kreuztabelle auch nur als Werkzeug verwendet, um Daten zu vergleichen oder aufzubereiten, beispielsweise für Darstellungen im Zeitverlauf oder bei der [[Datenbereinigung]]. Kreuztablellen bestehen in der Regel aus einem Tabellenkopf, der die Spaltenbeschriftungen enthält und einer linken Randspalte, die die Zeilenbeschriftungen enthält. Wenn es sinnvoll möglich ist, werden die Summen der Spalten in der untersten Zeile aufgelistet, die Summen der Zeilen in der rechten Randspalte. Eine Kreuztabelle soll außerdem eine aussagekräftige Überschrift haben und ggf. Fußnoten, die Besonderheiten der Tabelle für den Leser nachvollziehbar erläutern. Fast immer stehen im Kopf der Tabellen die unabhängigen Variablen, also die, von denen man annimmt, daß sie auf andere Variablen wirken. Diese abhängigen Variablen stehen dann in den Zeilen der Tabelle. Bei der Kreuztabelle auf dem Bild wird angenommen, daß eine bestimmte inhaltliche Ausrichtung eines Beitrages Einfluß darauf hat, wie Parteien in denselben Beiträgen bewertet werden. ==Kreuztabellen bei SPSS== ===Das Menü "Deskriptive Statistiken|Kreuztabellen..."=== Kreuztabellen erzeugt man mit SPSS am einfachsten über das Menü "Analysieren|Deskriptive Statistiken|Kreuztabellen..."; das Menü "Analysieren|Tabellen..." ist für kompliziertere oder spezielle Tabellen gedacht und wird hier zunächst nicht besprochen. Im Menü "Kreuztabellen..." steht links zunächst die Variablenliste. Rechts kann man den Variablen ihre Positionen in der Tabelle zuweisen: #Zeilen: Abhängige Variablen werden in der Regel in den Zeilen (quer) angeordnet. Manchmal kann es - vor allem bei einer großen Anzahl von Variablenausprägungen, z.B. bei Themenlisten für die Inhaltsanalyse - jedoch auch nötig sein, die unabhängige Variable in die Zeilen zu schreiben. #Spalten: Hier ist normalerweise der Platz für die unabhängige Variable in einer Tabelle (vertikal, die Ausprägungen der unabhängigen Variablen stehen im Kopf der Tabelle). #Schichten: Mit Hilfe einer Schichtung kann man getrennte Kreuztabellen für die Ausprägungen einer dritten Variablen erstellen lassen. Eine solche Drittvariablenkontrolle dient der Überprüfung vermuteter Scheinkorrelationen. bceeaa9fccade6b16d8c1ebda1191abb29984af3 45 44 2019-04-14T13:28:37Z Trg 1 /* Kreuztabellen bei SPSS */ erweitert wikitext text/x-wiki Kreuztabellen geben bei der Analyse eines Datensatzes Auskunft über Zusammenhänge zwischen Variablen. Manchmal wird die Kreuztabelle auch nur als Werkzeug verwendet, um Daten zu vergleichen oder aufzubereiten, beispielsweise für Darstellungen im Zeitverlauf oder bei der [[Datenbereinigung]]. Kreuztablellen bestehen in der Regel aus einem Tabellenkopf, der die Spaltenbeschriftungen enthält und einer linken Randspalte, die die Zeilenbeschriftungen enthält. Wenn es sinnvoll möglich ist, werden die Summen der Spalten in der untersten Zeile aufgelistet, die Summen der Zeilen in der rechten Randspalte. Eine Kreuztabelle soll außerdem eine aussagekräftige Überschrift haben und ggf. Fußnoten, die Besonderheiten der Tabelle für den Leser nachvollziehbar erläutern. Fast immer stehen im Kopf der Tabellen die unabhängigen Variablen, also die, von denen man annimmt, daß sie auf andere Variablen wirken. Diese abhängigen Variablen stehen dann in den Zeilen der Tabelle. Bei der Kreuztabelle auf dem Bild wird angenommen, daß eine bestimmte inhaltliche Ausrichtung eines Beitrages Einfluß darauf hat, wie Parteien in denselben Beiträgen bewertet werden. ==Kreuztabellen bei SPSS== ===Das Menü "Deskriptive Statistiken|Kreuztabellen..."=== Kreuztabellen erzeugt man mit SPSS am einfachsten über das Menü "Analysieren|Deskriptive Statistiken|Kreuztabellen..."; das Menü "Analysieren|Tabellen..." ist für kompliziertere oder spezielle Tabellen gedacht und wird hier zunächst nicht besprochen. Im Menü "Kreuztabellen..." steht links zunächst die Variablenliste. Rechts kann man den Variablen ihre Positionen in der Tabelle zuweisen: #Zeilen: Abhängige Variablen werden in der Regel in den Zeilen (quer) angeordnet. Manchmal kann es - vor allem bei einer großen Anzahl von Variablenausprägungen, z.B. bei Themenlisten für die Inhaltsanalyse - jedoch auch nötig sein, die unabhängige Variable in die Zeilen zu schreiben. #Spalten: Hier ist normalerweise der Platz für die unabhängige Variable in einer Tabelle (vertikal, die Ausprägungen der unabhängigen Variablen stehen im Kopf der Tabelle). #Schichten: Mit Hilfe einer Schichtung kann man getrennte Kreuztabellen für die Ausprägungen einer dritten Variablen erstellen lassen. Eine solche Drittvariablenkontrolle dient der Überprüfung vermuteter Scheinkorrelationen. ===Das Untermenü "Zellen..."=== Bei Kreuztabellen-Analysen ist das Untermenü "Zellen..." das wichtigste Einstellungswerkzeug. Es ermöglicht festzulegen, wie die Werte für die Kreuztabelle berechnet werden, was für die Interpretation der Daten entscheidend ist. Die für übliche Analysen relevanten Optionen sind: *'''Häufigkeiten''': "Beobachtet" bedeutet, daß die tatsächlich im Datensatz vorkommenden Zahlen, wie sie auch in einer Häufigkeitsauszählung stehen, in die Tabellenzellen geschrieben werden. "Erwartet" bedeutet, daß (meist zusätzlich) die Häufigkeiten angegeben werden, die statistisch bei einer Zufallsverteilung der Daten zu erwarten wären. *'''Prozentwerte''': Bei einer zeilenweisen Berechnung von Prozentwerten, ergeben die Zahlen in einer Zeile zusammen 100 Prozent. Bei der spaltenweisen Berechnung, ergeben die Zahlen einer Spalte zusammen 100 Prozent. Steht die unabhängige Variable im Kopf, ist fast immer auch die spaltenweise Prozentuierung sinnvoll. Bei einer Gesamtprozentuierung wird in jede Zelle eingetragen, wieviel Prozent der Zelleninhalt ausmacht, wenn die gesamte Tabelle 100 Prozent repräsentiert. Diese Einstellung wird unter anderem für Paneluntersuchungen gebraucht. *'''Residuen''' werden für den Vergleich von Erwartungswert und beobachtetem Wert gebraucht. *'''Gewichtungsfaktoren''' erleichtern die Arbeit mit Bruchwerten für Fälle bei Kreuztabellen in gewichteten Datensätzen. e9609f07139b5c72ef3c51522ead4bce96408c14 46 45 2019-04-14T13:29:50Z Trg 1 /* Kreuztabellen bei SPSS */ erweitert wikitext text/x-wiki Kreuztabellen geben bei der Analyse eines Datensatzes Auskunft über Zusammenhänge zwischen Variablen. Manchmal wird die Kreuztabelle auch nur als Werkzeug verwendet, um Daten zu vergleichen oder aufzubereiten, beispielsweise für Darstellungen im Zeitverlauf oder bei der [[Datenbereinigung]]. Kreuztablellen bestehen in der Regel aus einem Tabellenkopf, der die Spaltenbeschriftungen enthält und einer linken Randspalte, die die Zeilenbeschriftungen enthält. Wenn es sinnvoll möglich ist, werden die Summen der Spalten in der untersten Zeile aufgelistet, die Summen der Zeilen in der rechten Randspalte. Eine Kreuztabelle soll außerdem eine aussagekräftige Überschrift haben und ggf. Fußnoten, die Besonderheiten der Tabelle für den Leser nachvollziehbar erläutern. Fast immer stehen im Kopf der Tabellen die unabhängigen Variablen, also die, von denen man annimmt, daß sie auf andere Variablen wirken. Diese abhängigen Variablen stehen dann in den Zeilen der Tabelle. Bei der Kreuztabelle auf dem Bild wird angenommen, daß eine bestimmte inhaltliche Ausrichtung eines Beitrages Einfluß darauf hat, wie Parteien in denselben Beiträgen bewertet werden. ==Kreuztabellen bei SPSS== ===Das Menü "Deskriptive Statistiken|Kreuztabellen..."=== Kreuztabellen erzeugt man mit SPSS am einfachsten über das Menü "Analysieren|Deskriptive Statistiken|Kreuztabellen..."; das Menü "Analysieren|Tabellen..." ist für kompliziertere oder spezielle Tabellen gedacht und wird hier zunächst nicht besprochen. Im Menü "Kreuztabellen..." steht links zunächst die Variablenliste. Rechts kann man den Variablen ihre Positionen in der Tabelle zuweisen: #Zeilen: Abhängige Variablen werden in der Regel in den Zeilen (quer) angeordnet. Manchmal kann es - vor allem bei einer großen Anzahl von Variablenausprägungen, z.B. bei Themenlisten für die Inhaltsanalyse - jedoch auch nötig sein, die unabhängige Variable in die Zeilen zu schreiben. #Spalten: Hier ist normalerweise der Platz für die unabhängige Variable in einer Tabelle (vertikal, die Ausprägungen der unabhängigen Variablen stehen im Kopf der Tabelle). #Schichten: Mit Hilfe einer Schichtung kann man getrennte Kreuztabellen für die Ausprägungen einer dritten Variablen erstellen lassen. Eine solche Drittvariablenkontrolle dient der Überprüfung vermuteter Scheinkorrelationen. ===Das Untermenü "Zellen..."=== Bei Kreuztabellen-Analysen ist das Untermenü "Zellen..." das wichtigste Einstellungswerkzeug. Es ermöglicht festzulegen, wie die Werte für die Kreuztabelle berechnet werden, was für die Interpretation der Daten entscheidend ist. Die für übliche Analysen relevanten Optionen sind: *'''Häufigkeiten''': "Beobachtet" bedeutet, daß die tatsächlich im Datensatz vorkommenden Zahlen, wie sie auch in einer Häufigkeitsauszählung stehen, in die Tabellenzellen geschrieben werden. "Erwartet" bedeutet, daß (meist zusätzlich) die Häufigkeiten angegeben werden, die statistisch bei einer Zufallsverteilung der Daten zu erwarten wären. *'''Prozentwerte''': Bei einer zeilenweisen Berechnung von Prozentwerten, ergeben die Zahlen in einer Zeile zusammen 100 Prozent. Bei der spaltenweisen Berechnung, ergeben die Zahlen einer Spalte zusammen 100 Prozent. Steht die unabhängige Variable im Kopf, ist fast immer auch die spaltenweise Prozentuierung sinnvoll. Bei einer Gesamtprozentuierung wird in jede Zelle eingetragen, wieviel Prozent der Zelleninhalt ausmacht, wenn die gesamte Tabelle 100 Prozent repräsentiert. Diese Einstellung wird unter anderem für Paneluntersuchungen gebraucht. *'''Residuen''' werden für den Vergleich von Erwartungswert und beobachtetem Wert gebraucht. *'''Gewichtungsfaktoren''' erleichtern die Arbeit mit Bruchwerten für Fälle bei Kreuztabellen in gewichteten Datensätzen. ===Weitere Untermenüs=== *Exakt...: Hiermit können sog. exakte Tests durchgeführt werden, um das Signifikanzniveau von Korrelationen zu untersuchen. Diese Funktion steht nicht in allen SPSS-Versionen zur Verfügung. *Statistik... ermöglicht die Berechnung von allerhand Korrelationskoeffizienten (siehe dort). *Format... dient der Einstellung des Tabellenaufbaus. 8642ff93787c8251b9a335259f876161f91fc907 47 46 2019-04-14T13:30:20Z Trg 1 /* Kreuztabellen bei SPSS */ +Kat wikitext text/x-wiki Kreuztabellen geben bei der Analyse eines Datensatzes Auskunft über Zusammenhänge zwischen Variablen. Manchmal wird die Kreuztabelle auch nur als Werkzeug verwendet, um Daten zu vergleichen oder aufzubereiten, beispielsweise für Darstellungen im Zeitverlauf oder bei der [[Datenbereinigung]]. Kreuztablellen bestehen in der Regel aus einem Tabellenkopf, der die Spaltenbeschriftungen enthält und einer linken Randspalte, die die Zeilenbeschriftungen enthält. Wenn es sinnvoll möglich ist, werden die Summen der Spalten in der untersten Zeile aufgelistet, die Summen der Zeilen in der rechten Randspalte. Eine Kreuztabelle soll außerdem eine aussagekräftige Überschrift haben und ggf. Fußnoten, die Besonderheiten der Tabelle für den Leser nachvollziehbar erläutern. Fast immer stehen im Kopf der Tabellen die unabhängigen Variablen, also die, von denen man annimmt, daß sie auf andere Variablen wirken. Diese abhängigen Variablen stehen dann in den Zeilen der Tabelle. Bei der Kreuztabelle auf dem Bild wird angenommen, daß eine bestimmte inhaltliche Ausrichtung eines Beitrages Einfluß darauf hat, wie Parteien in denselben Beiträgen bewertet werden. ==Kreuztabellen bei SPSS== ===Das Menü "Deskriptive Statistiken|Kreuztabellen..."=== Kreuztabellen erzeugt man mit SPSS am einfachsten über das Menü "Analysieren|Deskriptive Statistiken|Kreuztabellen..."; das Menü "Analysieren|Tabellen..." ist für kompliziertere oder spezielle Tabellen gedacht und wird hier zunächst nicht besprochen. Im Menü "Kreuztabellen..." steht links zunächst die Variablenliste. Rechts kann man den Variablen ihre Positionen in der Tabelle zuweisen: #Zeilen: Abhängige Variablen werden in der Regel in den Zeilen (quer) angeordnet. Manchmal kann es - vor allem bei einer großen Anzahl von Variablenausprägungen, z.B. bei Themenlisten für die Inhaltsanalyse - jedoch auch nötig sein, die unabhängige Variable in die Zeilen zu schreiben. #Spalten: Hier ist normalerweise der Platz für die unabhängige Variable in einer Tabelle (vertikal, die Ausprägungen der unabhängigen Variablen stehen im Kopf der Tabelle). #Schichten: Mit Hilfe einer Schichtung kann man getrennte Kreuztabellen für die Ausprägungen einer dritten Variablen erstellen lassen. Eine solche Drittvariablenkontrolle dient der Überprüfung vermuteter Scheinkorrelationen. ===Das Untermenü "Zellen..."=== Bei Kreuztabellen-Analysen ist das Untermenü "Zellen..." das wichtigste Einstellungswerkzeug. Es ermöglicht festzulegen, wie die Werte für die Kreuztabelle berechnet werden, was für die Interpretation der Daten entscheidend ist. Die für übliche Analysen relevanten Optionen sind: *'''Häufigkeiten''': "Beobachtet" bedeutet, daß die tatsächlich im Datensatz vorkommenden Zahlen, wie sie auch in einer Häufigkeitsauszählung stehen, in die Tabellenzellen geschrieben werden. "Erwartet" bedeutet, daß (meist zusätzlich) die Häufigkeiten angegeben werden, die statistisch bei einer Zufallsverteilung der Daten zu erwarten wären. *'''Prozentwerte''': Bei einer zeilenweisen Berechnung von Prozentwerten, ergeben die Zahlen in einer Zeile zusammen 100 Prozent. Bei der spaltenweisen Berechnung, ergeben die Zahlen einer Spalte zusammen 100 Prozent. Steht die unabhängige Variable im Kopf, ist fast immer auch die spaltenweise Prozentuierung sinnvoll. Bei einer Gesamtprozentuierung wird in jede Zelle eingetragen, wieviel Prozent der Zelleninhalt ausmacht, wenn die gesamte Tabelle 100 Prozent repräsentiert. Diese Einstellung wird unter anderem für Paneluntersuchungen gebraucht. *'''Residuen''' werden für den Vergleich von Erwartungswert und beobachtetem Wert gebraucht. *'''Gewichtungsfaktoren''' erleichtern die Arbeit mit Bruchwerten für Fälle bei Kreuztabellen in gewichteten Datensätzen. ===Weitere Untermenüs=== *Exakt...: Hiermit können sog. exakte Tests durchgeführt werden, um das Signifikanzniveau von Korrelationen zu untersuchen. Diese Funktion steht nicht in allen SPSS-Versionen zur Verfügung. *Statistik... ermöglicht die Berechnung von allerhand Korrelationskoeffizienten (siehe dort). *Format... dient der Einstellung des Tabellenaufbaus. [[Kategorie:SPSS-Kurs]] e60a230746ba605fad1a735d12d9d0282cf606b7 Mehrfachantworten 0 26 49 2019-04-14T14:58:39Z Trg 1 Wiederherstelung wikitext text/x-wiki Mehrfachantworten braucht man, wenn mehrere Variablen zu Sets zusammengefaßt werden müssen. Das ist zum Beispiel dann der Fall, wenn auf eine Frage mehrere Antworten gegeben werden können oder bei Inhaltsanalysen mehrere Ausprägungen einer Eigenschaft der Analyseeinheit verschlüsselt werden sollen. ===Beispiele=== '''Befragung:''' Welche der folgenden Städte haben Sie schon einmal besucht (Mehrfachantworten möglich): [ ] London [ ] Düsseldorf [ ] Hamburg [ ] Rom [ ] Montreal [ ] keine der genannten Städte ''' Inhaltsanalyse:''' Für jeden Beitrag können bis zu drei Themen verschlüsselt werden. Thema 1: [ ][ ][ ] Thema 2: [ ][ ][ ] Thema 3: [ ][ ][ ] 608eb567d00a95b238b61d9f8d9ba0e42b13dd94 50 49 2019-04-14T15:00:14Z Trg 1 erweitert wikitext text/x-wiki Mehrfachantworten braucht man, wenn mehrere Variablen zu Sets zusammengefaßt werden müssen. Das ist zum Beispiel dann der Fall, wenn auf eine Frage mehrere Antworten gegeben werden können oder bei Inhaltsanalysen mehrere Ausprägungen einer Eigenschaft der Analyseeinheit verschlüsselt werden sollen. ===Beispiele=== '''Befragung:''' Welche der folgenden Städte haben Sie schon einmal besucht (Mehrfachantworten möglich): [ ] London [ ] Düsseldorf [ ] Hamburg [ ] Rom [ ] Montreal [ ] keine der genannten Städte ''' Inhaltsanalyse:''' Für jeden Beitrag können bis zu drei Themen verschlüsselt werden. Thema 1: [ ][ ][ ] Thema 2: [ ][ ][ ] Thema 3: [ ][ ][ ] ==Sets definieren== Die Mehrfachantworten-Funktionen von SPSS haben ein eigenes Menü recht weit unten im "Analysieren"-Menü: "Mehrfachantwort...|Sets-definieren", "|Häufigkeiten" und "|Kreuztabellen". Mit den Mehrfachantworten-Sets kann nur über dieses Menü gearbeitet werden. Das Auswahlfenster für "Sets definieren" besteht aus einer Variablenliste links, aus der die zu verbindenden Variablen ausgewählt werden können. Ausgewählte Variablen werden in der entsprechenden Liste angezeigt. Unter den Variablenlisten können folgende Einstellungen vorgenommen werden: *Bei dichotomen Variablen: Gezählter Wert. Trägt man beispielsweise bei allen Befragten, die eine bestimmte Stadt schon einmal besucht haben, eine 1 ein (und 0 für 'nicht besucht') würde man als gezählten Wert für diese Dichotomie 1 angeben. *Bei kategorialen Variablen: Bereich, der berücksichtigt werden soll. Hat man beispielsweise bei einer Inhaltsanalyse eine Themenliste von 100 bis 955 und will für die Mehrfachantworten-Analyse die Werte 200-800 berücksichtigen, würde man die entsprechenden Werte hier in die Felder eintragen. *Name. Name für das Set; SPSS stellt ihm automatisch ein Dollarzeichen ($) voran. *Beschriftung. Ein Label für das Set, ggf. aussagekräftiger als der Name. d3ee29fc279fbf089b21bfe0b5a9132a5242d451 51 50 2019-04-14T15:01:15Z Trg 1 erweitert wikitext text/x-wiki Mehrfachantworten braucht man, wenn mehrere Variablen zu Sets zusammengefaßt werden müssen. Das ist zum Beispiel dann der Fall, wenn auf eine Frage mehrere Antworten gegeben werden können oder bei Inhaltsanalysen mehrere Ausprägungen einer Eigenschaft der Analyseeinheit verschlüsselt werden sollen. ===Beispiele=== '''Befragung:''' Welche der folgenden Städte haben Sie schon einmal besucht (Mehrfachantworten möglich): [ ] London [ ] Düsseldorf [ ] Hamburg [ ] Rom [ ] Montreal [ ] keine der genannten Städte ''' Inhaltsanalyse:''' Für jeden Beitrag können bis zu drei Themen verschlüsselt werden. Thema 1: [ ][ ][ ] Thema 2: [ ][ ][ ] Thema 3: [ ][ ][ ] ==Sets definieren== Die Mehrfachantworten-Funktionen von SPSS haben ein eigenes Menü recht weit unten im "Analysieren"-Menü: "Mehrfachantwort...|Sets-definieren", "|Häufigkeiten" und "|Kreuztabellen". Mit den Mehrfachantworten-Sets kann nur über dieses Menü gearbeitet werden. Das Auswahlfenster für "Sets definieren" besteht aus einer Variablenliste links, aus der die zu verbindenden Variablen ausgewählt werden können. Ausgewählte Variablen werden in der entsprechenden Liste angezeigt. Unter den Variablenlisten können folgende Einstellungen vorgenommen werden: *Bei dichotomen Variablen: Gezählter Wert. Trägt man beispielsweise bei allen Befragten, die eine bestimmte Stadt schon einmal besucht haben, eine 1 ein (und 0 für 'nicht besucht') würde man als gezählten Wert für diese Dichotomie 1 angeben. *Bei kategorialen Variablen: Bereich, der berücksichtigt werden soll. Hat man beispielsweise bei einer Inhaltsanalyse eine Themenliste von 100 bis 955 und will für die Mehrfachantworten-Analyse die Werte 200-800 berücksichtigen, würde man die entsprechenden Werte hier in die Felder eintragen. *Name. Name für das Set; SPSS stellt ihm automatisch ein Dollarzeichen ($) voran. *Beschriftung. Ein Label für das Set, ggf. aussagekräftiger als der Name. Ein Klick auf "Hinzufügen" fügt das Set der Mehrfachantworten-Set-Sammlung hinzu. Mit "Ändern" kann man ein Set nachträglich bearbeiten und mit "Entfernen" löschen. Mehrfachantworten-Sets, die mit Hilfe dieser Prozedur erzeugt wurden, können nicht gespeichert werden. Sie gehen bei Beendigung von SPSS verloren und müssen in der nächsten Sitzung neu eingerichtet werden. In der SPSS-Version 14 gibt es unter dem Menüpunkt Daten|Mehrfachantworten-Sets die Möglichkeit, Mehrfachantwortensetzt dauerhaft anzulegen. Diese Sets können allerdings nur in benutzerdefinierten Tabellen und Diagrammen verwendet werden. Anderen Prozeduren (z.B. den herkömmlichen [[Kreuztabellen]]) stehen sie nicht zur Verfügung. f9c8491ae7d3eb557498ed2c278b921f02fdbdc1 Mehrfachantworten 0 26 52 51 2019-04-14T15:02:41Z Trg 1 erweitert wikitext text/x-wiki Mehrfachantworten braucht man, wenn mehrere Variablen zu Sets zusammengefaßt werden müssen. Das ist zum Beispiel dann der Fall, wenn auf eine Frage mehrere Antworten gegeben werden können oder bei Inhaltsanalysen mehrere Ausprägungen einer Eigenschaft der Analyseeinheit verschlüsselt werden sollen. ===Beispiele=== '''Befragung:''' Welche der folgenden Städte haben Sie schon einmal besucht (Mehrfachantworten möglich): [ ] London [ ] Düsseldorf [ ] Hamburg [ ] Rom [ ] Montreal [ ] keine der genannten Städte ''' Inhaltsanalyse:''' Für jeden Beitrag können bis zu drei Themen verschlüsselt werden. Thema 1: [ ][ ][ ] Thema 2: [ ][ ][ ] Thema 3: [ ][ ][ ] ==Sets definieren== Die Mehrfachantworten-Funktionen von SPSS haben ein eigenes Menü recht weit unten im "Analysieren"-Menü: "Mehrfachantwort...|Sets-definieren", "|Häufigkeiten" und "|Kreuztabellen". Mit den Mehrfachantworten-Sets kann nur über dieses Menü gearbeitet werden. Das Auswahlfenster für "Sets definieren" besteht aus einer Variablenliste links, aus der die zu verbindenden Variablen ausgewählt werden können. Ausgewählte Variablen werden in der entsprechenden Liste angezeigt. Unter den Variablenlisten können folgende Einstellungen vorgenommen werden: *Bei dichotomen Variablen: Gezählter Wert. Trägt man beispielsweise bei allen Befragten, die eine bestimmte Stadt schon einmal besucht haben, eine 1 ein (und 0 für 'nicht besucht') würde man als gezählten Wert für diese Dichotomie 1 angeben. *Bei kategorialen Variablen: Bereich, der berücksichtigt werden soll. Hat man beispielsweise bei einer Inhaltsanalyse eine Themenliste von 100 bis 955 und will für die Mehrfachantworten-Analyse die Werte 200-800 berücksichtigen, würde man die entsprechenden Werte hier in die Felder eintragen. *Name. Name für das Set; SPSS stellt ihm automatisch ein Dollarzeichen ($) voran. *Beschriftung. Ein Label für das Set, ggf. aussagekräftiger als der Name. Ein Klick auf "Hinzufügen" fügt das Set der Mehrfachantworten-Set-Sammlung hinzu. Mit "Ändern" kann man ein Set nachträglich bearbeiten und mit "Entfernen" löschen. Mehrfachantworten-Sets, die mit Hilfe dieser Prozedur erzeugt wurden, können nicht gespeichert werden. Sie gehen bei Beendigung von SPSS verloren und müssen in der nächsten Sitzung neu eingerichtet werden. In der SPSS-Version 14 gibt es unter dem Menüpunkt Daten|Mehrfachantworten-Sets die Möglichkeit, Mehrfachantwortensetzt dauerhaft anzulegen. Diese Sets können allerdings nur in benutzerdefinierten Tabellen und Diagrammen verwendet werden. Anderen Prozeduren (z.B. den herkömmlichen [[Kreuztabellen]]) stehen sie nicht zur Verfügung. ==Häufigkeiten für Mehrfachantworten-Sets== Über das Bedienfenster für die Häufigkeitsauszählung bei Mehrfachantworten-Sets kann man die Sets auswählen, für die man eine Häufigkeitsauszählung haben möchte. Außerdem kann man angeben, was bei fehlenden Werten geschehen soll: Listenweiser Ausschluß bedeutet, daß Fälle mit mindestens einem Missing in einer der beteiligten Variablen ganz aus der Tabelle ausgeschlossen werden. In der Häufigkeitstabelle fällt zunächst eine Unterscheidung auf, die bei Mehrfachantwortensets äußerst wichtig ist: "Prozent" und "Prozent der Fälle". *'''Prozent (der Antworten''') bedeutet, daß die Zahl der Antworten die Basis für die Prozentuierung bildet. Wie der Name Mehrfachantworten schon sagt, liegt die Zahl der Antworten oft über der Zahl der Fälle. Wenn jeder Befragte bis zu drei Städte besucht haben kann, ist die maximale Zahl der Antworten das Dreifache der Befragtenzahl. *'''Prozent der Fälle''' bedeutet, daß als Basis für die Prozentuierung der Antworten die Zahl der Befragten verwendet wird. In der Regel entstehen hier also Prozentsummen von über 100 Prozent. 466cc4c21fbad0449fc8eaca4f13c9b991c06571 53 52 2019-04-14T15:04:31Z Trg 1 erweitert wikitext text/x-wiki Mehrfachantworten braucht man, wenn mehrere Variablen zu Sets zusammengefaßt werden müssen. Das ist zum Beispiel dann der Fall, wenn auf eine Frage mehrere Antworten gegeben werden können oder bei Inhaltsanalysen mehrere Ausprägungen einer Eigenschaft der Analyseeinheit verschlüsselt werden sollen. ===Beispiele=== '''Befragung:''' Welche der folgenden Städte haben Sie schon einmal besucht (Mehrfachantworten möglich): [ ] London [ ] Düsseldorf [ ] Hamburg [ ] Rom [ ] Montreal [ ] keine der genannten Städte ''' Inhaltsanalyse:''' Für jeden Beitrag können bis zu drei Themen verschlüsselt werden. Thema 1: [ ][ ][ ] Thema 2: [ ][ ][ ] Thema 3: [ ][ ][ ] ==Sets definieren== Die Mehrfachantworten-Funktionen von SPSS haben ein eigenes Menü recht weit unten im "Analysieren"-Menü: "Mehrfachantwort...|Sets-definieren", "|Häufigkeiten" und "|Kreuztabellen". Mit den Mehrfachantworten-Sets kann nur über dieses Menü gearbeitet werden. Das Auswahlfenster für "Sets definieren" besteht aus einer Variablenliste links, aus der die zu verbindenden Variablen ausgewählt werden können. Ausgewählte Variablen werden in der entsprechenden Liste angezeigt. Unter den Variablenlisten können folgende Einstellungen vorgenommen werden: *Bei dichotomen Variablen: Gezählter Wert. Trägt man beispielsweise bei allen Befragten, die eine bestimmte Stadt schon einmal besucht haben, eine 1 ein (und 0 für 'nicht besucht') würde man als gezählten Wert für diese Dichotomie 1 angeben. *Bei kategorialen Variablen: Bereich, der berücksichtigt werden soll. Hat man beispielsweise bei einer Inhaltsanalyse eine Themenliste von 100 bis 955 und will für die Mehrfachantworten-Analyse die Werte 200-800 berücksichtigen, würde man die entsprechenden Werte hier in die Felder eintragen. *Name. Name für das Set; SPSS stellt ihm automatisch ein Dollarzeichen ($) voran. *Beschriftung. Ein Label für das Set, ggf. aussagekräftiger als der Name. Ein Klick auf "Hinzufügen" fügt das Set der Mehrfachantworten-Set-Sammlung hinzu. Mit "Ändern" kann man ein Set nachträglich bearbeiten und mit "Entfernen" löschen. Mehrfachantworten-Sets, die mit Hilfe dieser Prozedur erzeugt wurden, können nicht gespeichert werden. Sie gehen bei Beendigung von SPSS verloren und müssen in der nächsten Sitzung neu eingerichtet werden. In der SPSS-Version 14 gibt es unter dem Menüpunkt Daten|Mehrfachantworten-Sets die Möglichkeit, Mehrfachantwortensetzt dauerhaft anzulegen. Diese Sets können allerdings nur in benutzerdefinierten Tabellen und Diagrammen verwendet werden. Anderen Prozeduren (z.B. den herkömmlichen [[Kreuztabellen]]) stehen sie nicht zur Verfügung. ==Häufigkeiten für Mehrfachantworten-Sets== Über das Bedienfenster für die Häufigkeitsauszählung bei Mehrfachantworten-Sets kann man die Sets auswählen, für die man eine Häufigkeitsauszählung haben möchte. Außerdem kann man angeben, was bei fehlenden Werten geschehen soll: Listenweiser Ausschluß bedeutet, daß Fälle mit mindestens einem Missing in einer der beteiligten Variablen ganz aus der Tabelle ausgeschlossen werden. In der Häufigkeitstabelle fällt zunächst eine Unterscheidung auf, die bei Mehrfachantwortensets äußerst wichtig ist: "Prozent" und "Prozent der Fälle". *'''Prozent (der Antworten''') bedeutet, daß die Zahl der Antworten die Basis für die Prozentuierung bildet. Wie der Name Mehrfachantworten schon sagt, liegt die Zahl der Antworten oft über der Zahl der Fälle. Wenn jeder Befragte bis zu drei Städte besucht haben kann, ist die maximale Zahl der Antworten das Dreifache der Befragtenzahl. *'''Prozent der Fälle''' bedeutet, daß als Basis für die Prozentuierung der Antworten die Zahl der Befragten verwendet wird. In der Regel entstehen hier also Prozentsummen von über 100 Prozent. ==Kreuztabellen für Mehrfachantworten-Sets== Mehrfachantworten-Sets können sowohl untereinander, als uach mit Einzelvariablen "gekreuzt" werden. Das Bedienfenster dafür entspricht in etwa dem für normale Kreuztabellen. Zusätzlich müssen jedoch zwei Einstellungen unter "Optionen" vorgenommen werden. *"'''Variablen aus den Sets paaren'''" wird benötigt, wenn die Variablen aus Set1 und Set2 irgendwie zusammengehören. Beispiel: Wenn man bei einer Inhaltsanalyse drei Themen pro Beitrag verschlüsselt und zu jedem Thema eine besondere Eigenschaft, hängen Thema1 und Eigenschaft1, Thema2 und Eigenschaft2 etc. miteinander zusammen. In diesen Fällen sollte die Option zur Paarung von Variablen angekreuzt werden. *Wie bei der Häufigkeitstabelle muß man angeben, ob Prozentwerte auf '''Fälle''' oder '''Antworten''' bezogen sein sollen. 2a468ccb6928e376d3064bb705b98a624a5bdf71 54 53 2019-04-14T15:04:58Z Trg 1 +Kat wikitext text/x-wiki Mehrfachantworten braucht man, wenn mehrere Variablen zu Sets zusammengefaßt werden müssen. Das ist zum Beispiel dann der Fall, wenn auf eine Frage mehrere Antworten gegeben werden können oder bei Inhaltsanalysen mehrere Ausprägungen einer Eigenschaft der Analyseeinheit verschlüsselt werden sollen. ===Beispiele=== '''Befragung:''' Welche der folgenden Städte haben Sie schon einmal besucht (Mehrfachantworten möglich): [ ] London [ ] Düsseldorf [ ] Hamburg [ ] Rom [ ] Montreal [ ] keine der genannten Städte ''' Inhaltsanalyse:''' Für jeden Beitrag können bis zu drei Themen verschlüsselt werden. Thema 1: [ ][ ][ ] Thema 2: [ ][ ][ ] Thema 3: [ ][ ][ ] ==Sets definieren== Die Mehrfachantworten-Funktionen von SPSS haben ein eigenes Menü recht weit unten im "Analysieren"-Menü: "Mehrfachantwort...|Sets-definieren", "|Häufigkeiten" und "|Kreuztabellen". Mit den Mehrfachantworten-Sets kann nur über dieses Menü gearbeitet werden. Das Auswahlfenster für "Sets definieren" besteht aus einer Variablenliste links, aus der die zu verbindenden Variablen ausgewählt werden können. Ausgewählte Variablen werden in der entsprechenden Liste angezeigt. Unter den Variablenlisten können folgende Einstellungen vorgenommen werden: *Bei dichotomen Variablen: Gezählter Wert. Trägt man beispielsweise bei allen Befragten, die eine bestimmte Stadt schon einmal besucht haben, eine 1 ein (und 0 für 'nicht besucht') würde man als gezählten Wert für diese Dichotomie 1 angeben. *Bei kategorialen Variablen: Bereich, der berücksichtigt werden soll. Hat man beispielsweise bei einer Inhaltsanalyse eine Themenliste von 100 bis 955 und will für die Mehrfachantworten-Analyse die Werte 200-800 berücksichtigen, würde man die entsprechenden Werte hier in die Felder eintragen. *Name. Name für das Set; SPSS stellt ihm automatisch ein Dollarzeichen ($) voran. *Beschriftung. Ein Label für das Set, ggf. aussagekräftiger als der Name. Ein Klick auf "Hinzufügen" fügt das Set der Mehrfachantworten-Set-Sammlung hinzu. Mit "Ändern" kann man ein Set nachträglich bearbeiten und mit "Entfernen" löschen. Mehrfachantworten-Sets, die mit Hilfe dieser Prozedur erzeugt wurden, können nicht gespeichert werden. Sie gehen bei Beendigung von SPSS verloren und müssen in der nächsten Sitzung neu eingerichtet werden. In der SPSS-Version 14 gibt es unter dem Menüpunkt Daten|Mehrfachantworten-Sets die Möglichkeit, Mehrfachantwortensetzt dauerhaft anzulegen. Diese Sets können allerdings nur in benutzerdefinierten Tabellen und Diagrammen verwendet werden. Anderen Prozeduren (z.B. den herkömmlichen [[Kreuztabellen]]) stehen sie nicht zur Verfügung. ==Häufigkeiten für Mehrfachantworten-Sets== Über das Bedienfenster für die Häufigkeitsauszählung bei Mehrfachantworten-Sets kann man die Sets auswählen, für die man eine Häufigkeitsauszählung haben möchte. Außerdem kann man angeben, was bei fehlenden Werten geschehen soll: Listenweiser Ausschluß bedeutet, daß Fälle mit mindestens einem Missing in einer der beteiligten Variablen ganz aus der Tabelle ausgeschlossen werden. In der Häufigkeitstabelle fällt zunächst eine Unterscheidung auf, die bei Mehrfachantwortensets äußerst wichtig ist: "Prozent" und "Prozent der Fälle". *'''Prozent (der Antworten''') bedeutet, daß die Zahl der Antworten die Basis für die Prozentuierung bildet. Wie der Name Mehrfachantworten schon sagt, liegt die Zahl der Antworten oft über der Zahl der Fälle. Wenn jeder Befragte bis zu drei Städte besucht haben kann, ist die maximale Zahl der Antworten das Dreifache der Befragtenzahl. *'''Prozent der Fälle''' bedeutet, daß als Basis für die Prozentuierung der Antworten die Zahl der Befragten verwendet wird. In der Regel entstehen hier also Prozentsummen von über 100 Prozent. ==Kreuztabellen für Mehrfachantworten-Sets== Mehrfachantworten-Sets können sowohl untereinander, als uach mit Einzelvariablen "gekreuzt" werden. Das Bedienfenster dafür entspricht in etwa dem für normale Kreuztabellen. Zusätzlich müssen jedoch zwei Einstellungen unter "Optionen" vorgenommen werden. *"'''Variablen aus den Sets paaren'''" wird benötigt, wenn die Variablen aus Set1 und Set2 irgendwie zusammengehören. Beispiel: Wenn man bei einer Inhaltsanalyse drei Themen pro Beitrag verschlüsselt und zu jedem Thema eine besondere Eigenschaft, hängen Thema1 und Eigenschaft1, Thema2 und Eigenschaft2 etc. miteinander zusammen. In diesen Fällen sollte die Option zur Paarung von Variablen angekreuzt werden. *Wie bei der Häufigkeitstabelle muß man angeben, ob Prozentwerte auf '''Fälle''' oder '''Antworten''' bezogen sein sollen. [[Kategorie:SPSS-Kurs]] 4318dad7a8c83ee0bb98a7971f0e641eea102d75 62 54 2019-04-17T10:53:46Z Trg 1 typo wikitext text/x-wiki Mehrfachantworten braucht man, wenn mehrere Variablen zu Sets zusammengefaßt werden müssen. Das ist zum Beispiel dann der Fall, wenn auf eine Frage mehrere Antworten gegeben werden können oder bei Inhaltsanalysen mehrere Ausprägungen einer Eigenschaft der Analyseeinheit verschlüsselt werden sollen. ===Beispiele=== '''Befragung:''' Welche der folgenden Städte haben Sie schon einmal besucht (Mehrfachantworten möglich): [ ] London [ ] Düsseldorf [ ] Hamburg [ ] Rom [ ] Montreal [ ] keine der genannten Städte '''Inhaltsanalyse:''' Für jeden Beitrag können bis zu drei Themen verschlüsselt werden. Thema 1: [ ][ ][ ] Thema 2: [ ][ ][ ] Thema 3: [ ][ ][ ] ==Sets definieren== Die Mehrfachantworten-Funktionen von SPSS haben ein eigenes Menü recht weit unten im "Analysieren"-Menü: "Mehrfachantwort...|Sets-definieren", "|Häufigkeiten" und "|Kreuztabellen". Mit den Mehrfachantworten-Sets kann nur über dieses Menü gearbeitet werden. Das Auswahlfenster für "Sets definieren" besteht aus einer Variablenliste links, aus der die zu verbindenden Variablen ausgewählt werden können. Ausgewählte Variablen werden in der entsprechenden Liste angezeigt. Unter den Variablenlisten können folgende Einstellungen vorgenommen werden: *Bei dichotomen Variablen: Gezählter Wert. Trägt man beispielsweise bei allen Befragten, die eine bestimmte Stadt schon einmal besucht haben, eine 1 ein (und 0 für 'nicht besucht') würde man als gezählten Wert für diese Dichotomie 1 angeben. *Bei kategorialen Variablen: Bereich, der berücksichtigt werden soll. Hat man beispielsweise bei einer Inhaltsanalyse eine Themenliste von 100 bis 955 und will für die Mehrfachantworten-Analyse die Werte 200-800 berücksichtigen, würde man die entsprechenden Werte hier in die Felder eintragen. *Name. Name für das Set; SPSS stellt ihm automatisch ein Dollarzeichen ($) voran. *Beschriftung. Ein Label für das Set, ggf. aussagekräftiger als der Name. Ein Klick auf "Hinzufügen" fügt das Set der Mehrfachantworten-Set-Sammlung hinzu. Mit "Ändern" kann man ein Set nachträglich bearbeiten und mit "Entfernen" löschen. Mehrfachantworten-Sets, die mit Hilfe dieser Prozedur erzeugt wurden, können nicht gespeichert werden. Sie gehen bei Beendigung von SPSS verloren und müssen in der nächsten Sitzung neu eingerichtet werden. In der SPSS-Version 14 gibt es unter dem Menüpunkt Daten|Mehrfachantworten-Sets die Möglichkeit, Mehrfachantwortensetzt dauerhaft anzulegen. Diese Sets können allerdings nur in benutzerdefinierten Tabellen und Diagrammen verwendet werden. Anderen Prozeduren (z.B. den herkömmlichen [[Kreuztabellen]]) stehen sie nicht zur Verfügung. ==Häufigkeiten für Mehrfachantworten-Sets== Über das Bedienfenster für die Häufigkeitsauszählung bei Mehrfachantworten-Sets kann man die Sets auswählen, für die man eine Häufigkeitsauszählung haben möchte. Außerdem kann man angeben, was bei fehlenden Werten geschehen soll: Listenweiser Ausschluß bedeutet, daß Fälle mit mindestens einem Missing in einer der beteiligten Variablen ganz aus der Tabelle ausgeschlossen werden. In der Häufigkeitstabelle fällt zunächst eine Unterscheidung auf, die bei Mehrfachantwortensets äußerst wichtig ist: "Prozent" und "Prozent der Fälle". *'''Prozent (der Antworten''') bedeutet, daß die Zahl der Antworten die Basis für die Prozentuierung bildet. Wie der Name Mehrfachantworten schon sagt, liegt die Zahl der Antworten oft über der Zahl der Fälle. Wenn jeder Befragte bis zu drei Städte besucht haben kann, ist die maximale Zahl der Antworten das Dreifache der Befragtenzahl. *'''Prozent der Fälle''' bedeutet, daß als Basis für die Prozentuierung der Antworten die Zahl der Befragten verwendet wird. In der Regel entstehen hier also Prozentsummen von über 100 Prozent. ==Kreuztabellen für Mehrfachantworten-Sets== Mehrfachantworten-Sets können sowohl untereinander, als uach mit Einzelvariablen "gekreuzt" werden. Das Bedienfenster dafür entspricht in etwa dem für normale Kreuztabellen. Zusätzlich müssen jedoch zwei Einstellungen unter "Optionen" vorgenommen werden. *"'''Variablen aus den Sets paaren'''" wird benötigt, wenn die Variablen aus Set1 und Set2 irgendwie zusammengehören. Beispiel: Wenn man bei einer Inhaltsanalyse drei Themen pro Beitrag verschlüsselt und zu jedem Thema eine besondere Eigenschaft, hängen Thema1 und Eigenschaft1, Thema2 und Eigenschaft2 etc. miteinander zusammen. In diesen Fällen sollte die Option zur Paarung von Variablen angekreuzt werden. *Wie bei der Häufigkeitstabelle muß man angeben, ob Prozentwerte auf '''Fälle''' oder '''Antworten''' bezogen sein sollen. [[Kategorie:SPSS-Kurs]] 7bc50514de99d3e5aac6ff952f4b1304088428a4 T-Test 0 27 55 2019-04-14T15:09:19Z Trg 1 Wiederherstellung wikitext text/x-wiki Ein '''T-Test''' wird verwendet, um Mittelwerte zweier Stichproben bzw. Variablen miteinander zu vergleichen. SPSS bietet verschiedene Varianten des T-Tests an. Sie können über das Menü Analysieren|Mittelwerte aufgerufen werden. Der T-Test ist ein wichtiges Instrument zur Analyse der Daten, die bei sozialwissenschaftlichen Experimenten gewonnen wurden. ==T-Test bei einer Stichprobe== Hier wählt man eine Variable aus (die mindestens Intervall-Skalenniveau haben muß, damit Mittelwerte 'offiziell' überhaupt berechnet werden können) und gibt einen "Testwert" an. SPSS berechnet dann, ob der Stichprobenmittelwert signifikant (d.h. überzufällig mit einer gewissen Wahrscheinlichkeit) von diesem Testwert abweicht. Beispiel: Man vermutet, daß die durchschnittliche Körpergröße von Basketballspielern signifikant von der durchschnittlichen Körpergröße männlicher Deutscher(ca. 180 cm) abweicht. Findet man in einer Stichprobe von n=85 Basketballspielern eine Durchschnittsgröße von 211 cm, gibt man den Referenzwert ("Testwert", hier also 180 cm) als Testwert an und klickt auf "OK". SPSS gibt dann neben dem T-Wert und der Zahl der Freiheitsgrade auch die Signifikanz (die Wahrscheinlichkeit, daß die Abweichung des Stichprobenmittelwertes vom Testwert zufällig entstanden ist) und die Grenzen des Konfidenzintervalls an. Liegt die Zufalls-Wahrscheinlichkeit unter .05, spricht man im allgemeinen von einem signifikanten Ergebnis, liegt sie unter .001, von einem hochsignifikanten Ergebnis. SPSS gibt bei T-Tests in der Regel die zweiseitige Signifikanz aus. Das bedeutet, daß sich der Stichprobenmittelwert 'irgendwie' überzufällig vom Testwert unterscheidet. Hat man eine konkrete Vermutung über die Richtung des Unterschieds, ist der einseitige Signifikanzwert ausschlaggebend. Er entspricht dem halben zweiseitigen Wert. Das ist in der Regel gut für den Forscher, weil ein zweiseitiger Signifikanzwert von beispielsweise .07 (nicht signifikant auf dem 95%-Niveau) einem einseitigen Signifikanzwert von .035 entspricht (signifikant auf dem 95%-Niveau). In dem oben verwendeten Beispiel würde man selbstverständlich die gerichtete Vermutung haben, daß Basketballspieler größer sind als der Durchschnitt und deshalb den einseitigen Signifikanzwert verwenden. ==T-Test bei unabhängigen Stichproben== Dieser T-Test vergleicht die Mittelwerte zweier Gruppen. Sie sind unabhängig, wenn es sich einfach um zwei Personengruppen aus einer Grundgesamtheit handelt, z.B. Frauen und Männer aus einer Gruppe Studenten. Abhängige Stichproben dagegen sind entweder mit denselben Individuen besetzt (z.B. bei einer Mehrfachmessung zu unterschiedlichen Zeitpunkten) oder mit Personen, die nicht unabhängig voneinander sind (z.B. Ehemänner und Ehefrauen). Das Bedienfeld für den T-Test ermöglicht es oben die Variablen auszuwählen, deren Mittelwerte verglichen werden sollen. Darunter muß zusätzlich die Variable angegeben werden, nach der die zu vergleichenden Gruppen gebildet werden. Außerdem muß für diese Variable angegeben werden, welche Werte die Gruppen ausmachen (auf dem Screenshot ist zu sehen, daß es sich um die Variable "sex" (Geschlecht) handelt, deren Ausprägungen 1 (=männlich) und 2 (=weiblich) die Gruppen definieren. Alternativ kann auch ein Trennwert angegeben werden, beispielsweise das Alter 25, wenn ältere mit jüngeren Befragten oder Versuchspersonen verglichen werden sollen. Unter "Optionen" kann man einstellen, welches Signifikanzniveau gelten soll, ab wann man also bereit ist, von einer überzufälligen Mittelwertdifferenz zu sprechen. Üblicherweise liegt das Signifikanzniveau bei 95% (das bedeutet, daß ein Unterschied mit über 95prozentiger Wahrscheinlichkeit nicht zufällig entstanden sein darf, damit er signifikant genannt werden kann). Die SPSS-Ausgabe informiert unter Gruppenstatistiken zunächst über Mittelwerte und Standardabweichung der untersuchten Gruppen. Im oben abgedruckten Beispiel handelt es sich um das Alter je nach Geschlecht, bei einer Untersuchung unter Studenten. Oft kann man schon mit bloßem Auge erkennen, ob ein (theoretisch oder statistisch) bedeutsamer Mittelwert-Unterschied zu erwarten ist. Die nähere Analyse betrifft zunächst die Frage, ob die Varianz der beiden Gruppen annähernd gleich ist; nur dann darf der klassische T-Test angewandt werden. Der Levene-Test auf Varianzgleichheit gibt Auskunft darüber, mit welcher Wahrscheinlichkeit eine Gleichheit der Varianzen angenommen werden darf. Liegt der Signifikanzwert für den Levene-Test unter .05, sollte man in der Tabelle in der Zeile für "Varianzen sind nicht gleich" nachsehen. Wie man im hier verwendeten Beispiel leicht erkennt, können die Abweichungen zwischen dem T-Test für gleiche und dem für ungleiche Varianzen recht klein ausfallen; unter anderen Bedingungen (vor allem: kleinere Stichprobengröße), können sie jedoch auch bedeutende Ausmaße annehmen. T-Tests erfordern im allgemeinen, daß die untersuchten Variablen normalverteilt sind (Test auf Normalverteilung). Der T-Test für unabhängige Stichproben verträgt jedoch auch gewisse Abweichungen von einer perfekten Normalverteilung recht gut. ==T-Test bei gepaarten Stichproben== Bei gepaarten Stichproben müssen zufällige Stichprobenfehler nicht berücksichtigt werden, weil die Stichproben ja verbunden, also nicht unabhängig variierbar sind. Der T-Test untersucht hier, ob Mittelwert-Unterschiede durch zufällige Meßfehler zustande gekommen sind, oder als überzufällig angesehen werden können. Anstatt Gruppen von Befragten oder Versuchspersonen zu vergleichen, werden hier Variablen gepaart - beispielsweise ein Wert für den Mann und einer für die Frau, wenn ein Fall ein "Paar" repräsentiert; oder aber zwei Werte für einen Befragten, wenn die Messungen zu unterschiedlichen Zeitpunkten stattgefunden haben. Das entsprechende Bedienfenster ermöglicht es, Variablen durch Anklicken auszuwählen und zu paaren, die Optionen für die Berechnungen festzulegen und den T-Test zu starten. 6a4b88ba22b5fb5ae695085cabbbef5ebb20bf18 56 55 2019-04-14T15:09:54Z Trg 1 +Kat wikitext text/x-wiki Ein '''T-Test''' wird verwendet, um Mittelwerte zweier Stichproben bzw. Variablen miteinander zu vergleichen. SPSS bietet verschiedene Varianten des T-Tests an. Sie können über das Menü Analysieren|Mittelwerte aufgerufen werden. Der T-Test ist ein wichtiges Instrument zur Analyse der Daten, die bei sozialwissenschaftlichen Experimenten gewonnen wurden. ==T-Test bei einer Stichprobe== Hier wählt man eine Variable aus (die mindestens Intervall-Skalenniveau haben muß, damit Mittelwerte 'offiziell' überhaupt berechnet werden können) und gibt einen "Testwert" an. SPSS berechnet dann, ob der Stichprobenmittelwert signifikant (d.h. überzufällig mit einer gewissen Wahrscheinlichkeit) von diesem Testwert abweicht. Beispiel: Man vermutet, daß die durchschnittliche Körpergröße von Basketballspielern signifikant von der durchschnittlichen Körpergröße männlicher Deutscher(ca. 180 cm) abweicht. Findet man in einer Stichprobe von n=85 Basketballspielern eine Durchschnittsgröße von 211 cm, gibt man den Referenzwert ("Testwert", hier also 180 cm) als Testwert an und klickt auf "OK". SPSS gibt dann neben dem T-Wert und der Zahl der Freiheitsgrade auch die Signifikanz (die Wahrscheinlichkeit, daß die Abweichung des Stichprobenmittelwertes vom Testwert zufällig entstanden ist) und die Grenzen des Konfidenzintervalls an. Liegt die Zufalls-Wahrscheinlichkeit unter .05, spricht man im allgemeinen von einem signifikanten Ergebnis, liegt sie unter .001, von einem hochsignifikanten Ergebnis. SPSS gibt bei T-Tests in der Regel die zweiseitige Signifikanz aus. Das bedeutet, daß sich der Stichprobenmittelwert 'irgendwie' überzufällig vom Testwert unterscheidet. Hat man eine konkrete Vermutung über die Richtung des Unterschieds, ist der einseitige Signifikanzwert ausschlaggebend. Er entspricht dem halben zweiseitigen Wert. Das ist in der Regel gut für den Forscher, weil ein zweiseitiger Signifikanzwert von beispielsweise .07 (nicht signifikant auf dem 95%-Niveau) einem einseitigen Signifikanzwert von .035 entspricht (signifikant auf dem 95%-Niveau). In dem oben verwendeten Beispiel würde man selbstverständlich die gerichtete Vermutung haben, daß Basketballspieler größer sind als der Durchschnitt und deshalb den einseitigen Signifikanzwert verwenden. ==T-Test bei unabhängigen Stichproben== Dieser T-Test vergleicht die Mittelwerte zweier Gruppen. Sie sind unabhängig, wenn es sich einfach um zwei Personengruppen aus einer Grundgesamtheit handelt, z.B. Frauen und Männer aus einer Gruppe Studenten. Abhängige Stichproben dagegen sind entweder mit denselben Individuen besetzt (z.B. bei einer Mehrfachmessung zu unterschiedlichen Zeitpunkten) oder mit Personen, die nicht unabhängig voneinander sind (z.B. Ehemänner und Ehefrauen). Das Bedienfeld für den T-Test ermöglicht es oben die Variablen auszuwählen, deren Mittelwerte verglichen werden sollen. Darunter muß zusätzlich die Variable angegeben werden, nach der die zu vergleichenden Gruppen gebildet werden. Außerdem muß für diese Variable angegeben werden, welche Werte die Gruppen ausmachen (auf dem Screenshot ist zu sehen, daß es sich um die Variable "sex" (Geschlecht) handelt, deren Ausprägungen 1 (=männlich) und 2 (=weiblich) die Gruppen definieren. Alternativ kann auch ein Trennwert angegeben werden, beispielsweise das Alter 25, wenn ältere mit jüngeren Befragten oder Versuchspersonen verglichen werden sollen. Unter "Optionen" kann man einstellen, welches Signifikanzniveau gelten soll, ab wann man also bereit ist, von einer überzufälligen Mittelwertdifferenz zu sprechen. Üblicherweise liegt das Signifikanzniveau bei 95% (das bedeutet, daß ein Unterschied mit über 95prozentiger Wahrscheinlichkeit nicht zufällig entstanden sein darf, damit er signifikant genannt werden kann). Die SPSS-Ausgabe informiert unter Gruppenstatistiken zunächst über Mittelwerte und Standardabweichung der untersuchten Gruppen. Im oben abgedruckten Beispiel handelt es sich um das Alter je nach Geschlecht, bei einer Untersuchung unter Studenten. Oft kann man schon mit bloßem Auge erkennen, ob ein (theoretisch oder statistisch) bedeutsamer Mittelwert-Unterschied zu erwarten ist. Die nähere Analyse betrifft zunächst die Frage, ob die Varianz der beiden Gruppen annähernd gleich ist; nur dann darf der klassische T-Test angewandt werden. Der Levene-Test auf Varianzgleichheit gibt Auskunft darüber, mit welcher Wahrscheinlichkeit eine Gleichheit der Varianzen angenommen werden darf. Liegt der Signifikanzwert für den Levene-Test unter .05, sollte man in der Tabelle in der Zeile für "Varianzen sind nicht gleich" nachsehen. Wie man im hier verwendeten Beispiel leicht erkennt, können die Abweichungen zwischen dem T-Test für gleiche und dem für ungleiche Varianzen recht klein ausfallen; unter anderen Bedingungen (vor allem: kleinere Stichprobengröße), können sie jedoch auch bedeutende Ausmaße annehmen. T-Tests erfordern im allgemeinen, daß die untersuchten Variablen normalverteilt sind (Test auf Normalverteilung). Der T-Test für unabhängige Stichproben verträgt jedoch auch gewisse Abweichungen von einer perfekten Normalverteilung recht gut. ==T-Test bei gepaarten Stichproben== Bei gepaarten Stichproben müssen zufällige Stichprobenfehler nicht berücksichtigt werden, weil die Stichproben ja verbunden, also nicht unabhängig variierbar sind. Der T-Test untersucht hier, ob Mittelwert-Unterschiede durch zufällige Meßfehler zustande gekommen sind, oder als überzufällig angesehen werden können. Anstatt Gruppen von Befragten oder Versuchspersonen zu vergleichen, werden hier Variablen gepaart - beispielsweise ein Wert für den Mann und einer für die Frau, wenn ein Fall ein "Paar" repräsentiert; oder aber zwei Werte für einen Befragten, wenn die Messungen zu unterschiedlichen Zeitpunkten stattgefunden haben. Das entsprechende Bedienfenster ermöglicht es, Variablen durch Anklicken auszuwählen und zu paaren, die Optionen für die Berechnungen festzulegen und den T-Test zu starten. [[Kategorie:SPSS-Kurs]] a2df293a1bae1956ab6f2032619114fa7f329036 91 56 2019-04-18T09:52:21Z Trg 1 +kat wikitext text/x-wiki Ein '''T-Test''' wird verwendet, um Mittelwerte zweier Stichproben bzw. Variablen miteinander zu vergleichen. SPSS bietet verschiedene Varianten des T-Tests an. Sie können über das Menü Analysieren|Mittelwerte aufgerufen werden. Der T-Test ist ein wichtiges Instrument zur Analyse der Daten, die bei sozialwissenschaftlichen Experimenten gewonnen wurden. ==T-Test bei einer Stichprobe== Hier wählt man eine Variable aus (die mindestens Intervall-Skalenniveau haben muß, damit Mittelwerte 'offiziell' überhaupt berechnet werden können) und gibt einen "Testwert" an. SPSS berechnet dann, ob der Stichprobenmittelwert signifikant (d.h. überzufällig mit einer gewissen Wahrscheinlichkeit) von diesem Testwert abweicht. Beispiel: Man vermutet, daß die durchschnittliche Körpergröße von Basketballspielern signifikant von der durchschnittlichen Körpergröße männlicher Deutscher(ca. 180 cm) abweicht. Findet man in einer Stichprobe von n=85 Basketballspielern eine Durchschnittsgröße von 211 cm, gibt man den Referenzwert ("Testwert", hier also 180 cm) als Testwert an und klickt auf "OK". SPSS gibt dann neben dem T-Wert und der Zahl der Freiheitsgrade auch die Signifikanz (die Wahrscheinlichkeit, daß die Abweichung des Stichprobenmittelwertes vom Testwert zufällig entstanden ist) und die Grenzen des Konfidenzintervalls an. Liegt die Zufalls-Wahrscheinlichkeit unter .05, spricht man im allgemeinen von einem signifikanten Ergebnis, liegt sie unter .001, von einem hochsignifikanten Ergebnis. SPSS gibt bei T-Tests in der Regel die zweiseitige Signifikanz aus. Das bedeutet, daß sich der Stichprobenmittelwert 'irgendwie' überzufällig vom Testwert unterscheidet. Hat man eine konkrete Vermutung über die Richtung des Unterschieds, ist der einseitige Signifikanzwert ausschlaggebend. Er entspricht dem halben zweiseitigen Wert. Das ist in der Regel gut für den Forscher, weil ein zweiseitiger Signifikanzwert von beispielsweise .07 (nicht signifikant auf dem 95%-Niveau) einem einseitigen Signifikanzwert von .035 entspricht (signifikant auf dem 95%-Niveau). In dem oben verwendeten Beispiel würde man selbstverständlich die gerichtete Vermutung haben, daß Basketballspieler größer sind als der Durchschnitt und deshalb den einseitigen Signifikanzwert verwenden. ==T-Test bei unabhängigen Stichproben== Dieser T-Test vergleicht die Mittelwerte zweier Gruppen. Sie sind unabhängig, wenn es sich einfach um zwei Personengruppen aus einer Grundgesamtheit handelt, z.B. Frauen und Männer aus einer Gruppe Studenten. Abhängige Stichproben dagegen sind entweder mit denselben Individuen besetzt (z.B. bei einer Mehrfachmessung zu unterschiedlichen Zeitpunkten) oder mit Personen, die nicht unabhängig voneinander sind (z.B. Ehemänner und Ehefrauen). Das Bedienfeld für den T-Test ermöglicht es oben die Variablen auszuwählen, deren Mittelwerte verglichen werden sollen. Darunter muß zusätzlich die Variable angegeben werden, nach der die zu vergleichenden Gruppen gebildet werden. Außerdem muß für diese Variable angegeben werden, welche Werte die Gruppen ausmachen (auf dem Screenshot ist zu sehen, daß es sich um die Variable "sex" (Geschlecht) handelt, deren Ausprägungen 1 (=männlich) und 2 (=weiblich) die Gruppen definieren. Alternativ kann auch ein Trennwert angegeben werden, beispielsweise das Alter 25, wenn ältere mit jüngeren Befragten oder Versuchspersonen verglichen werden sollen. Unter "Optionen" kann man einstellen, welches Signifikanzniveau gelten soll, ab wann man also bereit ist, von einer überzufälligen Mittelwertdifferenz zu sprechen. Üblicherweise liegt das Signifikanzniveau bei 95% (das bedeutet, daß ein Unterschied mit über 95prozentiger Wahrscheinlichkeit nicht zufällig entstanden sein darf, damit er signifikant genannt werden kann). Die SPSS-Ausgabe informiert unter Gruppenstatistiken zunächst über Mittelwerte und Standardabweichung der untersuchten Gruppen. Im oben abgedruckten Beispiel handelt es sich um das Alter je nach Geschlecht, bei einer Untersuchung unter Studenten. Oft kann man schon mit bloßem Auge erkennen, ob ein (theoretisch oder statistisch) bedeutsamer Mittelwert-Unterschied zu erwarten ist. Die nähere Analyse betrifft zunächst die Frage, ob die Varianz der beiden Gruppen annähernd gleich ist; nur dann darf der klassische T-Test angewandt werden. Der Levene-Test auf Varianzgleichheit gibt Auskunft darüber, mit welcher Wahrscheinlichkeit eine Gleichheit der Varianzen angenommen werden darf. Liegt der Signifikanzwert für den Levene-Test unter .05, sollte man in der Tabelle in der Zeile für "Varianzen sind nicht gleich" nachsehen. Wie man im hier verwendeten Beispiel leicht erkennt, können die Abweichungen zwischen dem T-Test für gleiche und dem für ungleiche Varianzen recht klein ausfallen; unter anderen Bedingungen (vor allem: kleinere Stichprobengröße), können sie jedoch auch bedeutende Ausmaße annehmen. T-Tests erfordern im allgemeinen, daß die untersuchten Variablen normalverteilt sind (Test auf Normalverteilung). Der T-Test für unabhängige Stichproben verträgt jedoch auch gewisse Abweichungen von einer perfekten Normalverteilung recht gut. ==T-Test bei gepaarten Stichproben== Bei gepaarten Stichproben müssen zufällige Stichprobenfehler nicht berücksichtigt werden, weil die Stichproben ja verbunden, also nicht unabhängig variierbar sind. Der T-Test untersucht hier, ob Mittelwert-Unterschiede durch zufällige Meßfehler zustande gekommen sind, oder als überzufällig angesehen werden können. Anstatt Gruppen von Befragten oder Versuchspersonen zu vergleichen, werden hier Variablen gepaart - beispielsweise ein Wert für den Mann und einer für die Frau, wenn ein Fall ein "Paar" repräsentiert; oder aber zwei Werte für einen Befragten, wenn die Messungen zu unterschiedlichen Zeitpunkten stattgefunden haben. Das entsprechende Bedienfenster ermöglicht es, Variablen durch Anklicken auszuwählen und zu paaren, die Optionen für die Berechnungen festzulegen und den T-Test zu starten. [[Kategorie:SPSS-Kurs]] [[Kategorie:Statistik]] fadc471bbfa3596bb441875aa45ae27f4c6319dd ANOVA 0 28 57 2019-04-14T15:13:36Z Trg 1 Wiederherstellung wikitext text/x-wiki ANOVA ist ein SPSS-System für einfaktorielle Varianzanalysen. Man erreicht die ANOVA über das Menü Analysieren|Mittelwerte vergleichen. ==Bedienung== Das Anova-Bedienfenster erlaubt es eine Gruppenvariable (unabhängige Variable) und mehrere abhängige Variablen (Kriteriumsvariablen) auszuwählen. Die ANOVA berechnet dann, ob sich die Mittelwerte der Kriteriumsvariablen für die einzelnen Ausprägungen der Gruppenvariable unterscheiden. Die Schaltflächen für Zusatzeinstellungen haben folgende Funktionen: *Kontraste...: Hier werden die Mittelwerte einzelner Gruppen zu zwei Gruppen zusammengefaßt und durch einen t-Test direkt verglichen. So lassen sich zum Beispiel bei einer Varianzanalyse, die die Mathematiknoten von Schülern dreier Schulen A, B und C untersucht, die Gruppen A und C zusammenfassen und mit der Gruppe B vergleichen. *Post hoc...: Die Varianzanalyse gibt nur Auskunft darüber, ob sich irgendeine Gruppe signifikant von irgendeiner anderen unterscheidet. Welche Gruppen sich wie unterscheiden, muß durch zusätzliche Berechnungen geklärt werden. Die ANOVA hat mehrere solcher Mehrfachvergleiche vorrätig, je nachdem ob Varianzgleichheit der beteiligten Gruppen angenommen werden kann, oder nicht. Einige wichtige Post-Hoc-Tests sind unten im Zusammenhang mit dem Beispiel diskutiert. Für weitere Informationen über die komplizierteren Tests und ihre Vor- und Nachteile sei auf die einschlägige Literatur verwiesen. *Optionen...: Hier kann man zusätzliche Informationen ausgeben lassen, z.B. deskriptive Werte (siehe Streuung). Da man oft schon mit bloßem Auge Zusammenhänge und Unterschiede erkennen kann, ist es empfehlenswert, diese immer mit ausgeben zu lassen. Da zu den Voraussetzungen der Varianzanalyse Varianzgleichheit gehört, kann es auch nicht schaden, den "Test auf Homogenität der Varianzen" anzeigen zu lassen (Levene-Test, siehe [[T-Test]]). 872aa0612f11e3a2378f00ed58b82b1b1d637d56 Hauptseite 0 1 58 12 2019-04-14T15:17:57Z Trg 1 Datum ergänzt wikitext text/x-wiki <strong>Die Reparaturarbeiten laufen.</strong> Wegen eines Problems mit Updates muss diese Webseite neu aufgebaut werden. Das wird einige Zeit dauern (2019-04-14). ==SPSS-Kurs-Materialien == Im Wiederaufbau begriffen. *[[:Kategorie:SPSS-Kurs]] 2f0823b4809498b1b06b1cfe170cf063a1c2d489 97 58 2019-05-07T12:21:24Z Trg 1 /* SPSS-Kurs-Materialien */ + wikitext text/x-wiki <strong>Die Reparaturarbeiten laufen.</strong> Wegen eines Problems mit Updates muss diese Webseite neu aufgebaut werden. Das wird einige Zeit dauern (2019-04-14). ==SPSS-Kurs-Materialien == Wiederaufbau abgeschlossen -- allerdings mit weniger Grafiken als früher (2019-05-06). *[[:Kategorie:SPSS-Kurs]] d34b6f16046b9c595a86dc7de229633d18c601a3 98 97 2019-05-11T16:05:39Z Trg 1 + wikitext text/x-wiki <strong>Die Reparaturarbeiten laufen.</strong> Wegen eines Problems mit Updates muss diese Webseite neu aufgebaut werden. Das wird einige Zeit dauern (2019-04-14). Zuerst sind die populären SPSS-Materialien dran. ==SPSS-Kurs-Materialien == Wiederaufbau abgeschlossen -- allerdings mit weniger Grafiken als früher (2019-05-06). *[[:Kategorie:SPSS-Kurs]] 29fdb72efa8f6563c8d3330c30599bb44007604d Cronbachs Alpha 0 29 60 2019-04-17T10:51:41Z Trg 1 Wiederherstellung wikitext text/x-wiki '''Cronbachs Alpha''' ist ein Reliabilitätskoeffizient für Likert-Skalen und Item-Batterien beispielsweise aus Umfragen oder Inhaltsanalysen. Er gibt an, wie gut einzelne Skalen eines Meßinstruments untereinander korrelieren, wie zuverlässig das Gesamtinstrument also eine bestimmte Dimension mißt. Cronbachs Alpha sollte für eine kleine Anzahl von Items bei 0,7 oder darüber liegen. Cronbachs Alpha steigt jedoch bei gleicher Korrelation zwischen den Items mit der Zahl der Items an; bei einer Skala aus 20 Items beginnt der Wertebereich erst bei ca. 0,7, der konkrete Wert ist dann entsprechend anders zu interpretieren. Bei drei bis fünf Items ist die Verwendung von Cronbachs Alpha jedoch unbedenklich. ==Verwendung in SPSS== In SPSS wird Cronbachs Alpha auf Zwei Weisen verwendet. Erstens kann man sich für mehrere Items den Wert berechnen lassen, indem man unter Analysieren|Skalieren|Reliabilitätsanalyse... als Modell "Alpha" auswählt und OK klickt. Zweitens kann man sich für jedes Item anzeigen lassen, wie sich Cronbachs Alpha verändern würde, wenn man das fragliche Item aus der Skala entfernte. Das ist sehr praktisch um "schlechte" und "bessere" Items zu erkennen und ggf. seine Skala optimieren zu können. Dazu muß man unter Analysieren|Skalieren|Reliabilitätsanalyse...|Statistik... als Option "Skala wenn Item gelöscht" ankreuzen. ==Weblinks== [https://de.wikipedia.org/wiki/Cronbachs_Alpha Cronbachs Alpha bei de.wikipedia.org] b354a811036b8dafbfd4869d6f16e513b049108c 61 60 2019-04-17T10:52:42Z Trg 1 +kat wikitext text/x-wiki '''Cronbachs Alpha''' ist ein Reliabilitätskoeffizient für Likert-Skalen und Item-Batterien beispielsweise aus Umfragen oder Inhaltsanalysen. Er gibt an, wie gut einzelne Skalen eines Meßinstruments untereinander korrelieren, wie zuverlässig das Gesamtinstrument also eine bestimmte Dimension mißt. Cronbachs Alpha sollte für eine kleine Anzahl von Items bei 0,7 oder darüber liegen. Cronbachs Alpha steigt jedoch bei gleicher Korrelation zwischen den Items mit der Zahl der Items an; bei einer Skala aus 20 Items beginnt der Wertebereich erst bei ca. 0,7, der konkrete Wert ist dann entsprechend anders zu interpretieren. Bei drei bis fünf Items ist die Verwendung von Cronbachs Alpha jedoch unbedenklich. ==Verwendung in SPSS== In SPSS wird Cronbachs Alpha auf Zwei Weisen verwendet. Erstens kann man sich für mehrere Items den Wert berechnen lassen, indem man unter Analysieren|Skalieren|Reliabilitätsanalyse... als Modell "Alpha" auswählt und OK klickt. Zweitens kann man sich für jedes Item anzeigen lassen, wie sich Cronbachs Alpha verändern würde, wenn man das fragliche Item aus der Skala entfernte. Das ist sehr praktisch um "schlechte" und "bessere" Items zu erkennen und ggf. seine Skala optimieren zu können. Dazu muß man unter Analysieren|Skalieren|Reliabilitätsanalyse...|Statistik... als Option "Skala wenn Item gelöscht" ankreuzen. ==Weblinks== [https://de.wikipedia.org/wiki/Cronbachs_Alpha Cronbachs Alpha bei de.wikipedia.org] [[Kategorie:SPSS-Kurs]] d273d1c7cf2a95e07e18d6e02e808ff416a23e26 92 61 2019-04-18T09:53:01Z Trg 1 /* Weblinks */ +kat wikitext text/x-wiki '''Cronbachs Alpha''' ist ein Reliabilitätskoeffizient für Likert-Skalen und Item-Batterien beispielsweise aus Umfragen oder Inhaltsanalysen. Er gibt an, wie gut einzelne Skalen eines Meßinstruments untereinander korrelieren, wie zuverlässig das Gesamtinstrument also eine bestimmte Dimension mißt. Cronbachs Alpha sollte für eine kleine Anzahl von Items bei 0,7 oder darüber liegen. Cronbachs Alpha steigt jedoch bei gleicher Korrelation zwischen den Items mit der Zahl der Items an; bei einer Skala aus 20 Items beginnt der Wertebereich erst bei ca. 0,7, der konkrete Wert ist dann entsprechend anders zu interpretieren. Bei drei bis fünf Items ist die Verwendung von Cronbachs Alpha jedoch unbedenklich. ==Verwendung in SPSS== In SPSS wird Cronbachs Alpha auf Zwei Weisen verwendet. Erstens kann man sich für mehrere Items den Wert berechnen lassen, indem man unter Analysieren|Skalieren|Reliabilitätsanalyse... als Modell "Alpha" auswählt und OK klickt. Zweitens kann man sich für jedes Item anzeigen lassen, wie sich Cronbachs Alpha verändern würde, wenn man das fragliche Item aus der Skala entfernte. Das ist sehr praktisch um "schlechte" und "bessere" Items zu erkennen und ggf. seine Skala optimieren zu können. Dazu muß man unter Analysieren|Skalieren|Reliabilitätsanalyse...|Statistik... als Option "Skala wenn Item gelöscht" ankreuzen. ==Weblinks== [https://de.wikipedia.org/wiki/Cronbachs_Alpha Cronbachs Alpha bei de.wikipedia.org] [[Kategorie:SPSS-Kurs]] [[Kategorie:Statistik]] 7fb168d0a9e385bfc2934432d2c138a84f39041f Fälle gewichten 0 30 63 2019-04-17T10:56:11Z Trg 1 Wiederherstellung wikitext text/x-wiki Fälle werden meist dann gewichtet, wenn ihre Verteilung in einer Stichprobe nicht der Verteilung in der Grundgesamtheit entspricht. Sind beispielsweise deutlich mehr Frauen als Männer in einem Umfragedatensatz vertreten, müssen die Werte für die Frauen herunter- und die für die Männer heraufgewichtet werden um zu Ergebnissen zu kommen, die für eine Grundgesamtheit, in der Männer und Frauen ungefähr gleichverteilt sind, zutreffen. ==Gewichtungsfaktor== Ein einfaches Verfahren ist, das Verhältnis von Sollwert und Istwert zur Bildung von Gewichtungsfaktoren heranzuziehen. Angenommen, das Verhältnis Männer/Frauen in einer Grundgesamtheit sei 48% / 52%. Durch Stichproben-Fehler sind jedoch 39% Männer und 61% Frauen befragt worden. Der Gewichtungsfaktor ergibt sich jeweils aus dem Quotienten von Soll- und Istwert: G=Soll/Ist. Der Gewichtungsfaktor für die männlichen Befragten ist folglich 48% / 39% = 1,2. Der für die weiblichen Befragten ist 52% / 61% = 0,85. Durch Multiplikation der Werte in den übrigen Variablen mit den Gewichtungsfaktoren ergeben sich die gewichteten - und unter bestimmten Umständen für die Grundgesamtheit zutreffenderen - Ergebnisse. 60df7d8318defc24f53b0e0a2aeb3b63559a1494 64 63 2019-04-17T10:59:03Z Trg 1 erweitert, +kat wikitext text/x-wiki Fälle werden meist dann gewichtet, wenn ihre Verteilung in einer Stichprobe nicht der Verteilung in der Grundgesamtheit entspricht. Sind beispielsweise deutlich mehr Frauen als Männer in einem Umfragedatensatz vertreten, müssen die Werte für die Frauen herunter- und die für die Männer heraufgewichtet werden um zu Ergebnissen zu kommen, die für eine Grundgesamtheit, in der Männer und Frauen ungefähr gleichverteilt sind, zutreffen. ==Gewichtungsfaktor== Ein einfaches Verfahren ist, das Verhältnis von Sollwert und Istwert zur Bildung von Gewichtungsfaktoren heranzuziehen. Angenommen, das Verhältnis Männer/Frauen in einer Grundgesamtheit sei 48% / 52%. Durch Stichproben-Fehler sind jedoch 39% Männer und 61% Frauen befragt worden. Der Gewichtungsfaktor ergibt sich jeweils aus dem Quotienten von Soll- und Istwert: G=Soll/Ist. Der Gewichtungsfaktor für die männlichen Befragten ist folglich 48% / 39% = 1,2. Der für die weiblichen Befragten ist 52% / 61% = 0,85. Durch Multiplikation der Werte in den übrigen Variablen mit den Gewichtungsfaktoren ergeben sich die gewichteten - und unter bestimmten Umständen für die Grundgesamtheit zutreffenderen - Ergebnisse. ==Beispiel== Für das Beispiel wird ein Datensatz mit 100 Fällen verwendet, der, wie oben geschildert, 39 männliche und 61 weibliche ältere Befragte repräsentiert, obwohl es eigentlich (nach der Verteilung in der Grundgesamtheit) 48 männliche und 52 weibliche Befragte sein sollten. Da Männer und Frauen ein unterschiedlich hohes Alter erreichen (Frauen werden im Durchschnitt älter), schlägt sich diese Verteilung auch im Durchschnittswert des Alters nieder. Für die Gewichtung bildet man nun eine Gewichtungsvariable, die die Gewichtungsfaktoren jeweils für Männer und Frauen (siehe oben) enthält. Das geht am einfachsten mit Hilfe der Funktion Berechnen unter Einsatz der Berechnungsbedingungen (falls sex=1 und falls sex=2). Als nächstes muß der Datensatz gewichtet werden. Dafür steht im Menü "Daten" ganz unten der Punkt "Fälle gewichten..." zur Verfügung. Das Fälle-Gewichten-Fenster erlaubt es auszuwählen, ob ein Datensatz gewichtet werden soll und eine Variable für die Gewichtung auszuwählen (Abbildung 3). Nach dem Gewichten (die tatsächlichen Fallzahlen bleiben dabei gleich!) gehen Männer stärker und Frauen schwächer in die SPSS-Berechnungen ein. Man beachte, daß die Fallzahlen in der Häufigkeitstabelle verändert erscheinen, obwohl sie im Datensatz unverändert sind. Die Gewichtung ist eine rein interne Prozedur, die sich nicht auf den tatsächlichen Datensatz auswirkt. Die Abweichung vom angestrebten Verhältnis 48/52 ergibt sich durch Rundungen während der Berechnungen. Vorsicht: Das Abspeichern von gewichteten Datensätzen ist heikel. Man kann sich beim Laden eines gewichtet gespeicherten Datensatzes nie sicher sein, ob die Gewichtung mit gespeichert wurde oder nicht. Außerdem ist es gefährlich, wenn man aus Versehen mit einem gewichteten Datensatz rechnet, aber glaubt, Rohdaten vor sich zu haben. Beim Arbeiten mit Gewichtungen ist zu empfehlen, nur ungewichtete Datensätze zu speichern und beim Arbeiten gelegentlich zu überprüfen, wie der Gewichtungsstatus ist. [[Kategorie:SPSS-Kurs]] 311b2d2dbf88a627c800620d25021c7107a16aaa Fälle sortieren 0 31 65 2019-04-17T11:01:27Z Trg 1 Wiederherstellung wikitext text/x-wiki Mit der Funktion "'''Fälle sortieren'''..." aus dem Menü "Daten" kann man die Fälle in der SPSS-Datenansicht nach einem oder mehreren Kriterien sortieren. Die Variablen, nach denen sortiert werden soll, werden aus der Variablenliste links in das Fenster rechts verschoben. Man kann wählen, ob man eine aufsteigende oder absteigende Sortierung wünscht. Der Screenshot zeigt die Auswahl für eine Sortierung nach Datum (zuerst nach Monat, dann nach Tagen). Das Sortieren der Fälle ist insbesondere bei der Datenbereinigung wichtig, wenn man z.B. weiß, daß im Datensatz für den 16. August ein Fehler steckt und man sich die entsprechende Zeile im Datensatz einmal genauer betrachten möchte. Ohne die Sortierfunktion wäre diese Zeile in größeren Datensätzen schwer zu finden. [[Kategorie:SPSS-Kurs]] 676165622d75a604218610821ac30c0612c171b0 66 65 2019-04-17T11:02:00Z Trg 1 Wikilink wikitext text/x-wiki Mit der Funktion "'''Fälle sortieren'''..." aus dem Menü "Daten" kann man die Fälle in der SPSS-Datenansicht nach einem oder mehreren Kriterien sortieren. Die Variablen, nach denen sortiert werden soll, werden aus der Variablenliste links in das Fenster rechts verschoben. Man kann wählen, ob man eine aufsteigende oder absteigende Sortierung wünscht. Der Screenshot zeigt die Auswahl für eine Sortierung nach Datum (zuerst nach Monat, dann nach Tagen). Das Sortieren der Fälle ist insbesondere bei der [[Datenbereinigung]] wichtig, wenn man z.B. weiß, daß im Datensatz für den 16. August ein Fehler steckt und man sich die entsprechende Zeile im Datensatz einmal genauer betrachten möchte. Ohne die Sortierfunktion wäre diese Zeile in größeren Datensätzen schwer zu finden. [[Kategorie:SPSS-Kurs]] 48eaabfb1b27e2f353361b4845a28ce5da73666b Skalentypen 0 32 67 2019-04-17T11:03:45Z Trg 1 Wiederherstellung wikitext text/x-wiki Der '''Skalentyp''' bestimmt, welche Rechenoperationen mit den bei einer Messung gewonnenen Daten möglich sind. In der Statistik für Sozialwissenschaftler werden vier Skalentypen unterschieden: Nominalskala, Ordinalskala, Intervallskala und Ratio-Skala. Das Messniveau der beiden letzgenannten bezeichnet man auch als metrisch. 66ed152569c82ff5428774b77b7001b43811e22f 68 67 2019-04-17T11:06:07Z Trg 1 erweitert wikitext text/x-wiki Der '''Skalentyp''' bestimmt, welche Rechenoperationen mit den bei einer Messung gewonnenen Daten möglich sind. In der Statistik für Sozialwissenschaftler werden vier Skalentypen unterschieden: Nominalskala, Ordinalskala, Intervallskala und Ratio-Skala. Das Messniveau der beiden letzgenannten bezeichnet man auch als metrisch. ==Nominalskala== Bei einer Nominalskala werden Zahlen lediglich als Bezeichner (lateinisch Nomen) verwendet. Ein Beispiel ist 1:=männlich, 2:=weiblich. Mit nominalen Daten können nur die Operationen = und != ('gleich' und 'ungleich') "gerechnet" werden. Addition und Subtraktion sind nicht möglich, ebensowenig das Bilden von Durchschnitts- und Mittelwerten (was sollte man sich unter dem durchschnittlichen Geschlecht 1,4 vorstellen?). ==Ordinalskala== Eine Ordinalskala besteht aus Werten, die zwar eine Rangfolge bilden, jedoch ohne daß die Abstände zwischen den einzelnen Skalenpunkten gleich wären (fehlende Äquidistanz). Das bekannteste Beispiel für eine Ordninalskala sind Schulnoten. Eine 1 ist eine bessere Note als eine 2 und eine 6 eine schlechtere als eine 5. Es ist jedoch nicht gesagt, daß der Qualitätsunterschied zwischen 1 und 2 genau dem zwischen 5 und 6 entspricht. Mit Ordinalskalen kann man zusätzlich zu = und != auch die Operatoren < und > verwenden. Das Berechnen von Durschnitts- und Mittelwerten ist weiterhin, wegen der fehlenden Äquidistanz der Skalenpunkte, nicht zulässig. In den Sozialwissenschaften ist es jedoch üblich, Äquidistanz anzunehmen und entsprechende Berechnungen durchzuführen (z.B. Mittelwertvergleiche und Varianzanalysen bei experimentell gewonnenen Daten, die auf Likert-Skalen beruhen). ==Intervallskala== Intervallskalen sind solche, bei denen die Skalenpunkte tatsächlich den gleichen Abstand voneinander haben, z.B. die Temeperaturskala nach Celsius. Allerdings entspricht bei Intervallskalen der Nullpunkt nicht der Null im empirischen Relativ (also der Wirklichkeit, die bei einer Messung mit Hilfe der Skala auf ein numerisches Relativ abgebildet werden soll). 0°C sind nicht gleichbedeutend mit 'keine Temperatur vorhanden'. Deshalb darf man mit intervallskalierten Daten keine Multiplikationen oder Divisionen durchführen, aber sehr wohl Durchschnitts- und Mittelwerte bilden. 20°C sind '''nicht''' doppelt so warm wie 10°C. Man kann aber in einem Wintermonat eine Durchschnittstemperatur von 4,2°C ermitteln. fbcf3e90c1c02487311328d0de81f391fa390dae 69 68 2019-04-17T11:07:50Z Trg 1 erweitert wikitext text/x-wiki Der '''Skalentyp''' bestimmt, welche Rechenoperationen mit den bei einer Messung gewonnenen Daten möglich sind. In der Statistik für Sozialwissenschaftler werden vier Skalentypen unterschieden: Nominalskala, Ordinalskala, Intervallskala und Ratio-Skala. Das Messniveau der beiden letzgenannten bezeichnet man auch als metrisch. ==Nominalskala== Bei einer Nominalskala werden Zahlen lediglich als Bezeichner (lateinisch Nomen) verwendet. Ein Beispiel ist 1:=männlich, 2:=weiblich. Mit nominalen Daten können nur die Operationen = und != ('gleich' und 'ungleich') "gerechnet" werden. Addition und Subtraktion sind nicht möglich, ebensowenig das Bilden von Durchschnitts- und Mittelwerten (was sollte man sich unter dem durchschnittlichen Geschlecht 1,4 vorstellen?). ==Ordinalskala== Eine Ordinalskala besteht aus Werten, die zwar eine Rangfolge bilden, jedoch ohne daß die Abstände zwischen den einzelnen Skalenpunkten gleich wären (fehlende Äquidistanz). Das bekannteste Beispiel für eine Ordninalskala sind Schulnoten. Eine 1 ist eine bessere Note als eine 2 und eine 6 eine schlechtere als eine 5. Es ist jedoch nicht gesagt, daß der Qualitätsunterschied zwischen 1 und 2 genau dem zwischen 5 und 6 entspricht. Mit Ordinalskalen kann man zusätzlich zu = und != auch die Operatoren < und > verwenden. Das Berechnen von Durschnitts- und Mittelwerten ist weiterhin, wegen der fehlenden Äquidistanz der Skalenpunkte, nicht zulässig. In den Sozialwissenschaften ist es jedoch üblich, Äquidistanz anzunehmen und entsprechende Berechnungen durchzuführen (z.B. Mittelwertvergleiche und Varianzanalysen bei experimentell gewonnenen Daten, die auf Likert-Skalen beruhen). ==Intervallskala== Intervallskalen sind solche, bei denen die Skalenpunkte tatsächlich den gleichen Abstand voneinander haben, z.B. die Temeperaturskala nach Celsius. Allerdings entspricht bei Intervallskalen der Nullpunkt nicht der Null im empirischen Relativ (also der Wirklichkeit, die bei einer Messung mit Hilfe der Skala auf ein numerisches Relativ abgebildet werden soll). 0°C sind nicht gleichbedeutend mit 'keine Temperatur vorhanden'. Deshalb darf man mit intervallskalierten Daten keine Multiplikationen oder Divisionen durchführen, aber sehr wohl Durchschnitts- und Mittelwerte bilden. 20°C sind '''nicht''' doppelt so warm wie 10°C. Man kann aber in einem Wintermonat eine Durchschnittstemperatur von 4,2°C ermitteln. ==Ratio-Skala== Die Ratioskala, auch Verhältnisskala genannt, hat einen definierten Nullpunkt, bei dem die Null im numerischen Relativ (Skalenpunkt) tatsächlich der Null (=nicht vorhanden) im empirischen Relativ entspricht. Wer 20 Jahre alt ist, ist doppelt so alt, wie jemand, der 10 Jahre alt ist. 200 Kelvin entsprechen doppelt so viel thermischer Energie wie 100 Kelvin (weil der Nullpunkt der Kelvin-Temperaturskala als Abwesenheit thermischer Energie definiert ist). Mit den Werten einer Ratioskala können alle gebräuchlichen statistisch-mathematischen Operationen durchgeführt werden. ==Siehe auch== [[Variablen definieren]] 42d203fa1af0153cbe7f95a4970225b73600ff9e 70 69 2019-04-17T11:08:29Z Trg 1 +kat wikitext text/x-wiki Der '''Skalentyp''' bestimmt, welche Rechenoperationen mit den bei einer Messung gewonnenen Daten möglich sind. In der Statistik für Sozialwissenschaftler werden vier Skalentypen unterschieden: Nominalskala, Ordinalskala, Intervallskala und Ratio-Skala. Das Messniveau der beiden letzgenannten bezeichnet man auch als metrisch. ==Nominalskala== Bei einer Nominalskala werden Zahlen lediglich als Bezeichner (lateinisch Nomen) verwendet. Ein Beispiel ist 1:=männlich, 2:=weiblich. Mit nominalen Daten können nur die Operationen = und != ('gleich' und 'ungleich') "gerechnet" werden. Addition und Subtraktion sind nicht möglich, ebensowenig das Bilden von Durchschnitts- und Mittelwerten (was sollte man sich unter dem durchschnittlichen Geschlecht 1,4 vorstellen?). ==Ordinalskala== Eine Ordinalskala besteht aus Werten, die zwar eine Rangfolge bilden, jedoch ohne daß die Abstände zwischen den einzelnen Skalenpunkten gleich wären (fehlende Äquidistanz). Das bekannteste Beispiel für eine Ordninalskala sind Schulnoten. Eine 1 ist eine bessere Note als eine 2 und eine 6 eine schlechtere als eine 5. Es ist jedoch nicht gesagt, daß der Qualitätsunterschied zwischen 1 und 2 genau dem zwischen 5 und 6 entspricht. Mit Ordinalskalen kann man zusätzlich zu = und != auch die Operatoren < und > verwenden. Das Berechnen von Durschnitts- und Mittelwerten ist weiterhin, wegen der fehlenden Äquidistanz der Skalenpunkte, nicht zulässig. In den Sozialwissenschaften ist es jedoch üblich, Äquidistanz anzunehmen und entsprechende Berechnungen durchzuführen (z.B. Mittelwertvergleiche und Varianzanalysen bei experimentell gewonnenen Daten, die auf Likert-Skalen beruhen). ==Intervallskala== Intervallskalen sind solche, bei denen die Skalenpunkte tatsächlich den gleichen Abstand voneinander haben, z.B. die Temeperaturskala nach Celsius. Allerdings entspricht bei Intervallskalen der Nullpunkt nicht der Null im empirischen Relativ (also der Wirklichkeit, die bei einer Messung mit Hilfe der Skala auf ein numerisches Relativ abgebildet werden soll). 0°C sind nicht gleichbedeutend mit 'keine Temperatur vorhanden'. Deshalb darf man mit intervallskalierten Daten keine Multiplikationen oder Divisionen durchführen, aber sehr wohl Durchschnitts- und Mittelwerte bilden. 20°C sind '''nicht''' doppelt so warm wie 10°C. Man kann aber in einem Wintermonat eine Durchschnittstemperatur von 4,2°C ermitteln. ==Ratio-Skala== Die Ratioskala, auch Verhältnisskala genannt, hat einen definierten Nullpunkt, bei dem die Null im numerischen Relativ (Skalenpunkt) tatsächlich der Null (=nicht vorhanden) im empirischen Relativ entspricht. Wer 20 Jahre alt ist, ist doppelt so alt, wie jemand, der 10 Jahre alt ist. 200 Kelvin entsprechen doppelt so viel thermischer Energie wie 100 Kelvin (weil der Nullpunkt der Kelvin-Temperaturskala als Abwesenheit thermischer Energie definiert ist). Mit den Werten einer Ratioskala können alle gebräuchlichen statistisch-mathematischen Operationen durchgeführt werden. ==Siehe auch== [[Variablen definieren]] [[Kategorie:SPSS-Kurs]] 957f9f08d8ff8662bf6520e480cf0dc20bdb67b3 96 70 2019-04-18T09:56:05Z Trg 1 +kat wikitext text/x-wiki Der '''Skalentyp''' bestimmt, welche Rechenoperationen mit den bei einer Messung gewonnenen Daten möglich sind. In der Statistik für Sozialwissenschaftler werden vier Skalentypen unterschieden: Nominalskala, Ordinalskala, Intervallskala und Ratio-Skala. Das Messniveau der beiden letzgenannten bezeichnet man auch als metrisch. ==Nominalskala== Bei einer Nominalskala werden Zahlen lediglich als Bezeichner (lateinisch Nomen) verwendet. Ein Beispiel ist 1:=männlich, 2:=weiblich. Mit nominalen Daten können nur die Operationen = und != ('gleich' und 'ungleich') "gerechnet" werden. Addition und Subtraktion sind nicht möglich, ebensowenig das Bilden von Durchschnitts- und Mittelwerten (was sollte man sich unter dem durchschnittlichen Geschlecht 1,4 vorstellen?). ==Ordinalskala== Eine Ordinalskala besteht aus Werten, die zwar eine Rangfolge bilden, jedoch ohne daß die Abstände zwischen den einzelnen Skalenpunkten gleich wären (fehlende Äquidistanz). Das bekannteste Beispiel für eine Ordninalskala sind Schulnoten. Eine 1 ist eine bessere Note als eine 2 und eine 6 eine schlechtere als eine 5. Es ist jedoch nicht gesagt, daß der Qualitätsunterschied zwischen 1 und 2 genau dem zwischen 5 und 6 entspricht. Mit Ordinalskalen kann man zusätzlich zu = und != auch die Operatoren < und > verwenden. Das Berechnen von Durschnitts- und Mittelwerten ist weiterhin, wegen der fehlenden Äquidistanz der Skalenpunkte, nicht zulässig. In den Sozialwissenschaften ist es jedoch üblich, Äquidistanz anzunehmen und entsprechende Berechnungen durchzuführen (z.B. Mittelwertvergleiche und Varianzanalysen bei experimentell gewonnenen Daten, die auf Likert-Skalen beruhen). ==Intervallskala== Intervallskalen sind solche, bei denen die Skalenpunkte tatsächlich den gleichen Abstand voneinander haben, z.B. die Temeperaturskala nach Celsius. Allerdings entspricht bei Intervallskalen der Nullpunkt nicht der Null im empirischen Relativ (also der Wirklichkeit, die bei einer Messung mit Hilfe der Skala auf ein numerisches Relativ abgebildet werden soll). 0°C sind nicht gleichbedeutend mit 'keine Temperatur vorhanden'. Deshalb darf man mit intervallskalierten Daten keine Multiplikationen oder Divisionen durchführen, aber sehr wohl Durchschnitts- und Mittelwerte bilden. 20°C sind '''nicht''' doppelt so warm wie 10°C. Man kann aber in einem Wintermonat eine Durchschnittstemperatur von 4,2°C ermitteln. ==Ratio-Skala== Die Ratioskala, auch Verhältnisskala genannt, hat einen definierten Nullpunkt, bei dem die Null im numerischen Relativ (Skalenpunkt) tatsächlich der Null (=nicht vorhanden) im empirischen Relativ entspricht. Wer 20 Jahre alt ist, ist doppelt so alt, wie jemand, der 10 Jahre alt ist. 200 Kelvin entsprechen doppelt so viel thermischer Energie wie 100 Kelvin (weil der Nullpunkt der Kelvin-Temperaturskala als Abwesenheit thermischer Energie definiert ist). Mit den Werten einer Ratioskala können alle gebräuchlichen statistisch-mathematischen Operationen durchgeführt werden. ==Siehe auch== [[Variablen definieren]] [[Kategorie:SPSS-Kurs]] [[Kategorie:Statistik]] e47a0bcefb8fd91f78a31c9aa12220d84369a500 Normalverteilung 0 33 71 2019-04-17T11:16:38Z Trg 1 Wiederherstellung wikitext text/x-wiki Als '''Normalverteilung''' (auch: Gauß-Verteilung) bezeichnet man eine Verteilung, die unimodal (nur ein Höhepunkt bzw. Gipfel), glockenförmig und symmetrisch ist. Bei Normalverteilungen liegt der Mittelwert (auch Erwartungswert genannt) in der Mitte (Symmetrie). Im Bereich von minus einer Standardabweichung und plus einer Standardabweichung (s) liegen ungefähr zwei Drittel aller Fälle (genau: 68,26%). Im Bereich von -2s bis +2s liegen ca. 95 Prozent aller Fälle (genau 95,44%). Die Glockenkurve nähert sich asymptotisch auf beiden Seiten der X-Achse an. Normalverteilung, Quelle: [1] Eine Standardnormalverteilung liegt vor, wenn der Mittelwert Null ist, und die Standardabweichung eins. ==Siehe auch== [[Test auf Normalverteilung]] [[Kategorie:SPSS-Kurs]] 6872164b69d542b70ee94e82b13c1f0964dfaf0a 94 71 2019-04-18T09:55:08Z Trg 1 /* Siehe auch */ +kat wikitext text/x-wiki Als '''Normalverteilung''' (auch: Gauß-Verteilung) bezeichnet man eine Verteilung, die unimodal (nur ein Höhepunkt bzw. Gipfel), glockenförmig und symmetrisch ist. Bei Normalverteilungen liegt der Mittelwert (auch Erwartungswert genannt) in der Mitte (Symmetrie). Im Bereich von minus einer Standardabweichung und plus einer Standardabweichung (s) liegen ungefähr zwei Drittel aller Fälle (genau: 68,26%). Im Bereich von -2s bis +2s liegen ca. 95 Prozent aller Fälle (genau 95,44%). Die Glockenkurve nähert sich asymptotisch auf beiden Seiten der X-Achse an. Normalverteilung, Quelle: [1] Eine Standardnormalverteilung liegt vor, wenn der Mittelwert Null ist, und die Standardabweichung eins. ==Siehe auch== [[Test auf Normalverteilung]] [[Kategorie:SPSS-Kurs]] [[Kategorie:Statistik]] 9fd8ccb1531067cbc5bd2d5707070ff2055d76ff 100 94 2019-05-18T20:20:30Z Trg 1 Trümmer geräumt wikitext text/x-wiki Als '''Normalverteilung''' (auch: Gauß-Verteilung) bezeichnet man eine Verteilung, die unimodal (nur ein Höhepunkt bzw. Gipfel), glockenförmig und symmetrisch ist. Bei Normalverteilungen liegt der Mittelwert (auch Erwartungswert genannt) in der Mitte (Symmetrie). Im Bereich von minus einer Standardabweichung und plus einer Standardabweichung (s) liegen ungefähr zwei Drittel aller Fälle (genau: 68,26%). Im Bereich von -2s bis +2s liegen ca. 95 Prozent aller Fälle (genau 95,44%). Die Glockenkurve nähert sich asymptotisch auf beiden Seiten der X-Achse an. Eine Standardnormalverteilung liegt vor, wenn der Mittelwert Null ist, und die Standardabweichung eins. ==Siehe auch== [[Test auf Normalverteilung]] [[Kategorie:SPSS-Kurs]] [[Kategorie:Statistik]] f48c16bb28376e0ca251c49a49f04cd2424d1197 Test auf Normalverteilung 0 34 72 2019-04-17T11:32:14Z Trg 1 Wiederherstellung wikitext text/x-wiki Viele statistische Verfahren setzen voraus, daß die Daten (der Stichprobe) zumindest annähernd normalverteilt sind. Um diese Voraussetzung zu prüfen, bietet SPSS im Menü "Deskriptive Statistik|Explorative Datenanalyse" zwei statistische Testmöglichkeiten. Darüber hinaus sind in einige andere Analyseprozeduren Tests auf [[Normalverteilung]] integriert. Es gibt allerdings kaum eindeutige Kriterien, ab wann eine Abweichung von der Normalverteilung ein statistisches Verfahren wirklich stört. Bedenklich werden Abweichungen jedenfalls dann, wenn eine Verteilung sehr schief oder mehrgipflig ist. ==Kolmogorov-Smirnov-Test== Der Kolmogorov-Smirnov-Test kann unter "Explorative Datenanalyse..." ausgewählt werden, indem man auf "Diagramme" klickt und dann "Normalverteilungsdiagramm mit Tests" markiert. Relevant für die Interpretation ist die Angabe und "Signifikanz". Je kleiner dieser Wert ist, desto unwahrscheinlicher ist eine Normalverteilung. Wenn SPSS hier .000 ausgibt, sollte auf jeden Fall Abstand von einer Annahme der Normalverteilung genommen werden. da9d2e5ff924c6daa202f0bd0780e479431108e1 73 72 2019-04-17T11:38:18Z Trg 1 erweitert wikitext text/x-wiki Viele statistische Verfahren setzen voraus, daß die Daten (der Stichprobe) zumindest annähernd normalverteilt sind. Um diese Voraussetzung zu prüfen, bietet SPSS im Menü "Deskriptive Statistik|Explorative Datenanalyse" zwei statistische Testmöglichkeiten. Darüber hinaus sind in einige andere Analyseprozeduren Tests auf [[Normalverteilung]] integriert. Es gibt allerdings kaum eindeutige Kriterien, ab wann eine Abweichung von der Normalverteilung ein statistisches Verfahren wirklich stört. Bedenklich werden Abweichungen jedenfalls dann, wenn eine Verteilung sehr schief oder mehrgipflig ist. ==Kolmogorov-Smirnov-Test== Der Kolmogorov-Smirnov-Test kann unter "Explorative Datenanalyse..." ausgewählt werden, indem man auf "Diagramme" klickt und dann "Normalverteilungsdiagramm mit Tests" markiert. Relevant für die Interpretation ist die Angabe und "Signifikanz". Je kleiner dieser Wert ist, desto unwahrscheinlicher ist eine Normalverteilung. Wenn SPSS hier .000 ausgibt, sollte auf jeden Fall Abstand von einer Annahme der Normalverteilung genommen werden. ==Shapiro-Wilk-Test== Die Interpretation dieses Tests funktioniert genau wie die des Kolmogorov-Smirnov-Tests. Wenn die Zahl unter Signifikanz sehr klein oder gar .000 ist, kann man nicht vom Vorliegen einer Normalverteilung ausgehen. ==Sichtprüfung mit Graphiken== Die beiden statistischen Tests werden in der Literatur kaum behandelt und sind offenbar nicht besonders bedeutend. Einer anderen Vorgehensweise zum Test auf Normalverteilung wird dagegen große Bedeutung zugemessen: Dem einfachen Sichtvergleich einer Graphik der Stichprobendaten mit einem Bild einer Normalverteilung. Ist die Ähnlichkeit hinreichend groß (das heißt in den meisten Fällen: Ähnlichkeit mit einer symmetrischen, eingipfligen Glockenkurve), kann man davon ausgehen, daß die Anforderung "normalverteilt" erfüllt ist. ==Histogramm bei der Häufigkeitsauszählung== Bei einer Häufigkeitsauszählung kann mit Hilfe der Schaltfläche "Diagramme" eingestellt werden, daß ein "Histogramm mit Normalverteilungskurve" ausgegeben werden soll. Das Ergebnis sieht dann z.B. folgendermaßen aus: Das erste Bild zeigt eine mehrgipflige Verteilung, die keine Ähnlichkeit mit der Normalverteilung hat. Kolmogorov-Smirnov-Test und Shapiro-Wilk-Test ergeben für diese Daten eine Signifikanz von .000, bestätigen also den optischen Eindruck, daß hier keine Normalverteilung angenommen werden darf. Das zweite Bild ähnelt ganz offensichtlich einer Normalverteilung. Die Werte der beiden Tests sind für diese Daten deutlich größer als .000, allerdings kaum zu interpretieren. In solchen Fällen verläßt man sich besser auf den optischen Eindruck. ==Q-Q-Diagramm und trendbereinigtes Q-Q-Diagramm== Unter "Deskriptive Statistiken|Explorative Datenanalyse..." werden zusammen mit den beiden statistischen Tests auch zwei Graphiken mit ausgegeben. Die erste Graphik ist ein Q-Q-Diagramm, das die Meßwerte mit einer Gerade vergleicht, die eine Normalverteilung repräsentiert. Streuen die Werte eng und zufällig um die Gerade, kann man eine Normalverteilung der Daten annehmen. Q-Q-Diagramm Die zweite Graphik, die SPSS zusammen mit den beiden statistischen Tests ausgibt (trendbereinigtes Q-Q-Diagramm), erfüllt einen ähnlichen Zweck wie die erste, nur daß die Linie, die die Normalverteilung repräsentiert, nun horizontal ist. Die besten Aussichten auf normalverteilte Daten hat man, wenn die Daten zufällig und ohne Muster um die horizontale Linie streuen. 6d86d51a6b474fd9598a4f157aa95aa45392adf6 79 73 2019-04-17T11:44:58Z Trg 1 /* Histogramm bei der Häufigkeitsauszählung */ +2 Bilder wikitext text/x-wiki Viele statistische Verfahren setzen voraus, daß die Daten (der Stichprobe) zumindest annähernd normalverteilt sind. Um diese Voraussetzung zu prüfen, bietet SPSS im Menü "Deskriptive Statistik|Explorative Datenanalyse" zwei statistische Testmöglichkeiten. Darüber hinaus sind in einige andere Analyseprozeduren Tests auf [[Normalverteilung]] integriert. Es gibt allerdings kaum eindeutige Kriterien, ab wann eine Abweichung von der Normalverteilung ein statistisches Verfahren wirklich stört. Bedenklich werden Abweichungen jedenfalls dann, wenn eine Verteilung sehr schief oder mehrgipflig ist. ==Kolmogorov-Smirnov-Test== Der Kolmogorov-Smirnov-Test kann unter "Explorative Datenanalyse..." ausgewählt werden, indem man auf "Diagramme" klickt und dann "Normalverteilungsdiagramm mit Tests" markiert. Relevant für die Interpretation ist die Angabe und "Signifikanz". Je kleiner dieser Wert ist, desto unwahrscheinlicher ist eine Normalverteilung. Wenn SPSS hier .000 ausgibt, sollte auf jeden Fall Abstand von einer Annahme der Normalverteilung genommen werden. ==Shapiro-Wilk-Test== Die Interpretation dieses Tests funktioniert genau wie die des Kolmogorov-Smirnov-Tests. Wenn die Zahl unter Signifikanz sehr klein oder gar .000 ist, kann man nicht vom Vorliegen einer Normalverteilung ausgehen. ==Sichtprüfung mit Graphiken== Die beiden statistischen Tests werden in der Literatur kaum behandelt und sind offenbar nicht besonders bedeutend. Einer anderen Vorgehensweise zum Test auf Normalverteilung wird dagegen große Bedeutung zugemessen: Dem einfachen Sichtvergleich einer Graphik der Stichprobendaten mit einem Bild einer Normalverteilung. Ist die Ähnlichkeit hinreichend groß (das heißt in den meisten Fällen: Ähnlichkeit mit einer symmetrischen, eingipfligen Glockenkurve), kann man davon ausgehen, daß die Anforderung "normalverteilt" erfüllt ist. ==Histogramm bei der Häufigkeitsauszählung== Bei einer Häufigkeitsauszählung kann mit Hilfe der Schaltfläche "Diagramme" eingestellt werden, daß ein "Histogramm mit Normalverteilungskurve" ausgegeben werden soll. Das Ergebnis sieht dann z.B. folgendermaßen aus: [[Datei:Histogramm1.jpg]] [[Datei:Histogramm2.jpg]] Das erste Bild zeigt eine mehrgipflige Verteilung, die keine Ähnlichkeit mit der Normalverteilung hat. Kolmogorov-Smirnov-Test und Shapiro-Wilk-Test ergeben für diese Daten eine Signifikanz von .000, bestätigen also den optischen Eindruck, daß hier keine Normalverteilung angenommen werden darf. Das zweite Bild ähnelt ganz offensichtlich einer Normalverteilung. Die Werte der beiden Tests sind für diese Daten deutlich größer als .000, allerdings kaum zu interpretieren. In solchen Fällen verläßt man sich besser auf den optischen Eindruck. ==Q-Q-Diagramm und trendbereinigtes Q-Q-Diagramm== Unter "Deskriptive Statistiken|Explorative Datenanalyse..." werden zusammen mit den beiden statistischen Tests auch zwei Graphiken mit ausgegeben. Die erste Graphik ist ein Q-Q-Diagramm, das die Meßwerte mit einer Gerade vergleicht, die eine Normalverteilung repräsentiert. Streuen die Werte eng und zufällig um die Gerade, kann man eine Normalverteilung der Daten annehmen. Q-Q-Diagramm Die zweite Graphik, die SPSS zusammen mit den beiden statistischen Tests ausgibt (trendbereinigtes Q-Q-Diagramm), erfüllt einen ähnlichen Zweck wie die erste, nur daß die Linie, die die Normalverteilung repräsentiert, nun horizontal ist. Die besten Aussichten auf normalverteilte Daten hat man, wenn die Daten zufällig und ohne Muster um die horizontale Linie streuen. b0b925ce4c958c66a4514a456b6b4094df72c762 80 79 2019-04-17T11:46:29Z Trg 1 /* Q-Q-Diagramm und trendbereinigtes Q-Q-Diagramm */ +1 Bild, kat wikitext text/x-wiki Viele statistische Verfahren setzen voraus, daß die Daten (der Stichprobe) zumindest annähernd normalverteilt sind. Um diese Voraussetzung zu prüfen, bietet SPSS im Menü "Deskriptive Statistik|Explorative Datenanalyse" zwei statistische Testmöglichkeiten. Darüber hinaus sind in einige andere Analyseprozeduren Tests auf [[Normalverteilung]] integriert. Es gibt allerdings kaum eindeutige Kriterien, ab wann eine Abweichung von der Normalverteilung ein statistisches Verfahren wirklich stört. Bedenklich werden Abweichungen jedenfalls dann, wenn eine Verteilung sehr schief oder mehrgipflig ist. ==Kolmogorov-Smirnov-Test== Der Kolmogorov-Smirnov-Test kann unter "Explorative Datenanalyse..." ausgewählt werden, indem man auf "Diagramme" klickt und dann "Normalverteilungsdiagramm mit Tests" markiert. Relevant für die Interpretation ist die Angabe und "Signifikanz". Je kleiner dieser Wert ist, desto unwahrscheinlicher ist eine Normalverteilung. Wenn SPSS hier .000 ausgibt, sollte auf jeden Fall Abstand von einer Annahme der Normalverteilung genommen werden. ==Shapiro-Wilk-Test== Die Interpretation dieses Tests funktioniert genau wie die des Kolmogorov-Smirnov-Tests. Wenn die Zahl unter Signifikanz sehr klein oder gar .000 ist, kann man nicht vom Vorliegen einer Normalverteilung ausgehen. ==Sichtprüfung mit Graphiken== Die beiden statistischen Tests werden in der Literatur kaum behandelt und sind offenbar nicht besonders bedeutend. Einer anderen Vorgehensweise zum Test auf Normalverteilung wird dagegen große Bedeutung zugemessen: Dem einfachen Sichtvergleich einer Graphik der Stichprobendaten mit einem Bild einer Normalverteilung. Ist die Ähnlichkeit hinreichend groß (das heißt in den meisten Fällen: Ähnlichkeit mit einer symmetrischen, eingipfligen Glockenkurve), kann man davon ausgehen, daß die Anforderung "normalverteilt" erfüllt ist. ==Histogramm bei der Häufigkeitsauszählung== Bei einer Häufigkeitsauszählung kann mit Hilfe der Schaltfläche "Diagramme" eingestellt werden, daß ein "Histogramm mit Normalverteilungskurve" ausgegeben werden soll. Das Ergebnis sieht dann z.B. folgendermaßen aus: [[Datei:Histogramm1.jpg]] [[Datei:Histogramm2.jpg]] Das erste Bild zeigt eine mehrgipflige Verteilung, die keine Ähnlichkeit mit der Normalverteilung hat. Kolmogorov-Smirnov-Test und Shapiro-Wilk-Test ergeben für diese Daten eine Signifikanz von .000, bestätigen also den optischen Eindruck, daß hier keine Normalverteilung angenommen werden darf. Das zweite Bild ähnelt ganz offensichtlich einer Normalverteilung. Die Werte der beiden Tests sind für diese Daten deutlich größer als .000, allerdings kaum zu interpretieren. In solchen Fällen verläßt man sich besser auf den optischen Eindruck. ==Q-Q-Diagramm und trendbereinigtes Q-Q-Diagramm== Unter "Deskriptive Statistiken|Explorative Datenanalyse..." werden zusammen mit den beiden statistischen Tests auch zwei Graphiken mit ausgegeben. Die erste Graphik ist ein Q-Q-Diagramm, das die Meßwerte mit einer Gerade vergleicht, die eine Normalverteilung repräsentiert. Streuen die Werte eng und zufällig um die Gerade, kann man eine Normalverteilung der Daten annehmen. [[Datei:Qq1.jpg]] Die zweite Graphik, die SPSS zusammen mit den beiden statistischen Tests ausgibt (trendbereinigtes Q-Q-Diagramm), erfüllt einen ähnlichen Zweck wie die erste, nur daß die Linie, die die Normalverteilung repräsentiert, nun horizontal ist. Die besten Aussichten auf normalverteilte Daten hat man, wenn die Daten zufällig und ohne Muster um die horizontale Linie streuen. [[Kategorie:SPSS-Kurs]] d69336eff22b2c68c4c5d779533e7132ac67f97e 81 80 2019-04-17T11:47:11Z Trg 1 /* Q-Q-Diagramm und trendbereinigtes Q-Q-Diagramm */ k wikitext text/x-wiki Viele statistische Verfahren setzen voraus, daß die Daten (der Stichprobe) zumindest annähernd normalverteilt sind. Um diese Voraussetzung zu prüfen, bietet SPSS im Menü "Deskriptive Statistik|Explorative Datenanalyse" zwei statistische Testmöglichkeiten. Darüber hinaus sind in einige andere Analyseprozeduren Tests auf [[Normalverteilung]] integriert. Es gibt allerdings kaum eindeutige Kriterien, ab wann eine Abweichung von der Normalverteilung ein statistisches Verfahren wirklich stört. Bedenklich werden Abweichungen jedenfalls dann, wenn eine Verteilung sehr schief oder mehrgipflig ist. ==Kolmogorov-Smirnov-Test== Der Kolmogorov-Smirnov-Test kann unter "Explorative Datenanalyse..." ausgewählt werden, indem man auf "Diagramme" klickt und dann "Normalverteilungsdiagramm mit Tests" markiert. Relevant für die Interpretation ist die Angabe und "Signifikanz". Je kleiner dieser Wert ist, desto unwahrscheinlicher ist eine Normalverteilung. Wenn SPSS hier .000 ausgibt, sollte auf jeden Fall Abstand von einer Annahme der Normalverteilung genommen werden. ==Shapiro-Wilk-Test== Die Interpretation dieses Tests funktioniert genau wie die des Kolmogorov-Smirnov-Tests. Wenn die Zahl unter Signifikanz sehr klein oder gar .000 ist, kann man nicht vom Vorliegen einer Normalverteilung ausgehen. ==Sichtprüfung mit Graphiken== Die beiden statistischen Tests werden in der Literatur kaum behandelt und sind offenbar nicht besonders bedeutend. Einer anderen Vorgehensweise zum Test auf Normalverteilung wird dagegen große Bedeutung zugemessen: Dem einfachen Sichtvergleich einer Graphik der Stichprobendaten mit einem Bild einer Normalverteilung. Ist die Ähnlichkeit hinreichend groß (das heißt in den meisten Fällen: Ähnlichkeit mit einer symmetrischen, eingipfligen Glockenkurve), kann man davon ausgehen, daß die Anforderung "normalverteilt" erfüllt ist. ==Histogramm bei der Häufigkeitsauszählung== Bei einer Häufigkeitsauszählung kann mit Hilfe der Schaltfläche "Diagramme" eingestellt werden, daß ein "Histogramm mit Normalverteilungskurve" ausgegeben werden soll. Das Ergebnis sieht dann z.B. folgendermaßen aus: [[Datei:Histogramm1.jpg]] [[Datei:Histogramm2.jpg]] Das erste Bild zeigt eine mehrgipflige Verteilung, die keine Ähnlichkeit mit der Normalverteilung hat. Kolmogorov-Smirnov-Test und Shapiro-Wilk-Test ergeben für diese Daten eine Signifikanz von .000, bestätigen also den optischen Eindruck, daß hier keine Normalverteilung angenommen werden darf. Das zweite Bild ähnelt ganz offensichtlich einer Normalverteilung. Die Werte der beiden Tests sind für diese Daten deutlich größer als .000, allerdings kaum zu interpretieren. In solchen Fällen verläßt man sich besser auf den optischen Eindruck. ==Q-Q-Diagramm und trendbereinigtes Q-Q-Diagramm== Unter "Deskriptive Statistiken|Explorative Datenanalyse..." werden zusammen mit den beiden statistischen Tests auch zwei Graphiken mit ausgegeben. Die erste Graphik ist ein Q-Q-Diagramm, das die Meßwerte mit einer Gerade vergleicht, die eine Normalverteilung repräsentiert. Streuen die Werte eng und zufällig um die Gerade, kann man eine Normalverteilung der Daten annehmen. [[Datei:Qq1.jpg]] Die zweite Graphik, die SPSS zusammen mit den beiden statistischen Tests ausgibt (trendbereinigtes Q-Q-Diagramm), erfüllt einen ähnlichen Zweck wie die erste, nur daß die Linie, die die Normalverteilung repräsentiert, nun horizontal ist. Die besten Aussichten auf normalverteilte Daten hat man, wenn die Daten zufällig und ohne Muster um die horizontale Linie streuen. [[Kategorie:SPSS-Kurs]] 90409069967e24efc0116fe789738ce8bf51505e 101 81 2019-05-18T20:21:35Z Trg 1 /* Histogramm bei der Häufigkeitsauszählung */ typo wikitext text/x-wiki Viele statistische Verfahren setzen voraus, daß die Daten (der Stichprobe) zumindest annähernd normalverteilt sind. Um diese Voraussetzung zu prüfen, bietet SPSS im Menü "Deskriptive Statistik|Explorative Datenanalyse" zwei statistische Testmöglichkeiten. Darüber hinaus sind in einige andere Analyseprozeduren Tests auf [[Normalverteilung]] integriert. Es gibt allerdings kaum eindeutige Kriterien, ab wann eine Abweichung von der Normalverteilung ein statistisches Verfahren wirklich stört. Bedenklich werden Abweichungen jedenfalls dann, wenn eine Verteilung sehr schief oder mehrgipflig ist. ==Kolmogorov-Smirnov-Test== Der Kolmogorov-Smirnov-Test kann unter "Explorative Datenanalyse..." ausgewählt werden, indem man auf "Diagramme" klickt und dann "Normalverteilungsdiagramm mit Tests" markiert. Relevant für die Interpretation ist die Angabe und "Signifikanz". Je kleiner dieser Wert ist, desto unwahrscheinlicher ist eine Normalverteilung. Wenn SPSS hier .000 ausgibt, sollte auf jeden Fall Abstand von einer Annahme der Normalverteilung genommen werden. ==Shapiro-Wilk-Test== Die Interpretation dieses Tests funktioniert genau wie die des Kolmogorov-Smirnov-Tests. Wenn die Zahl unter Signifikanz sehr klein oder gar .000 ist, kann man nicht vom Vorliegen einer Normalverteilung ausgehen. ==Sichtprüfung mit Graphiken== Die beiden statistischen Tests werden in der Literatur kaum behandelt und sind offenbar nicht besonders bedeutend. Einer anderen Vorgehensweise zum Test auf Normalverteilung wird dagegen große Bedeutung zugemessen: Dem einfachen Sichtvergleich einer Graphik der Stichprobendaten mit einem Bild einer Normalverteilung. Ist die Ähnlichkeit hinreichend groß (das heißt in den meisten Fällen: Ähnlichkeit mit einer symmetrischen, eingipfligen Glockenkurve), kann man davon ausgehen, daß die Anforderung "normalverteilt" erfüllt ist. ==Histogramm bei der Häufigkeitsauszählung== Bei einer Häufigkeitsauszählung kann mit Hilfe der Schaltfläche "Diagramme" eingestellt werden, daß ein "Histogramm mit Normalverteilungskurve" ausgegeben werden soll. Das Ergebnis sieht dann z.B. folgendermaßen aus: [[Datei:Histogramm1.jpg]] [[Datei:Histogramm2.jpg]] Das erste Bild zeigt eine mehrgipflige Verteilung, die keine Ähnlichkeit mit der Normalverteilung hat. Kolmogorov-Smirnov-Test und Shapiro-Wilk-Test ergeben für diese Daten eine Signifikanz von .000, bestätigen also den optischen Eindruck, daß hier keine Normalverteilung angenommen werden darf. Das zweite Bild ähnelt ganz offensichtlich einer Normalverteilung. Die Werte der beiden Tests sind für diese Daten deutlich größer als .000, allerdings kaum zu interpretieren. In solchen Fällen verlässt man sich besser auf den optischen Eindruck. ==Q-Q-Diagramm und trendbereinigtes Q-Q-Diagramm== Unter "Deskriptive Statistiken|Explorative Datenanalyse..." werden zusammen mit den beiden statistischen Tests auch zwei Graphiken mit ausgegeben. Die erste Graphik ist ein Q-Q-Diagramm, das die Meßwerte mit einer Gerade vergleicht, die eine Normalverteilung repräsentiert. Streuen die Werte eng und zufällig um die Gerade, kann man eine Normalverteilung der Daten annehmen. [[Datei:Qq1.jpg]] Die zweite Graphik, die SPSS zusammen mit den beiden statistischen Tests ausgibt (trendbereinigtes Q-Q-Diagramm), erfüllt einen ähnlichen Zweck wie die erste, nur daß die Linie, die die Normalverteilung repräsentiert, nun horizontal ist. Die besten Aussichten auf normalverteilte Daten hat man, wenn die Daten zufällig und ohne Muster um die horizontale Linie streuen. [[Kategorie:SPSS-Kurs]] e23ebd9e493b17ac40c67a869bfcde5e9ac76270 Datei:Histogramm1.jpg 6 35 74 2019-04-17T11:39:22Z Trg 1 SPSS-Histogramm - keine Normalverteilung wikitext text/x-wiki == Beschreibung == SPSS-Histogramm - keine Normalverteilung cb9def5e95ae2c4dcd410d44358fccd3d1d1ad1d Datei:Histogramm2.jpg 6 36 75 2019-04-17T11:40:22Z Trg 1 SPSS-Histogramm: Ähnlichkeit mit Normalverteilung wikitext text/x-wiki == Beschreibung == SPSS-Histogramm: Ähnlichkeit mit Normalverteilung 4394b511e444e597f43635bd23a6193a049889b1 77 75 2019-04-17T11:44:01Z Trg 1 Trg verschob die Seite [[Datei:Histrogramm2.jpg]] nach [[Datei:Histogramm2.jpg]]: peinlicher Tippfehelr im Dateinamen wikitext text/x-wiki == Beschreibung == SPSS-Histogramm: Ähnlichkeit mit Normalverteilung 4394b511e444e597f43635bd23a6193a049889b1 Datei:Qq1.jpg 6 37 76 2019-04-17T11:40:53Z Trg 1 SPSS-QQ-Diagramm wikitext text/x-wiki == Beschreibung == SPSS-QQ-Diagramm ebe0c3a2d812f348784548bc3aead727acf9f5ce Werte zählen 0 39 82 2019-04-17T11:52:55Z Trg 1 Wiederherstellung wikitext text/x-wiki "Werte zählen..." erreicht man über das Nenü "Transformieren|Zählen...". Die Verwendungsmöglichkeiten dieser Funktion ähneln dem "Berechnen" für sehr einfache Aufgabenstellungen. "Zählen" erzeugt eine neue Variable, in der steht, wie oft ein bestimmter Wert oder Bereich aus mehreren anderen Variablen pro Fall (Zeile im Datensatz) aufgetreten ist. Die Bedienung der Funktion ähnelt dem Recodieren in andere Variablen. Man gibt zunächst Name und ggf. Label der Zielvariable an und dann, was die Funktion genau zählen soll. Auch hier kann man Bedingungen für die Ausführung der Funktion angeben. Das funktioniert genau wie unter Fälle auswählen beschrieben. Anwendungsbeispiel: Angenommen, man hat in einem Datensatz mehrere Likert-Skalen, die in ihren extremen Ausprägungen auf eine extreme politische Haltung hindeuten. Mit "Werte zählen..." kann man für jeden Befragten angeben, wie oft er einen dieser Extremismus-Indikatoren ausgewählt hat und mit diesen Werten in einer eigenen Variable weitere Berechnungen anstellen (z.B. Perzentile berechnen). [[Kategorie:SPSS-Kurs]] 2b121b71fcaa35c49cb1535b26073b7d03d46b40 83 82 2019-04-17T11:55:31Z Trg 1 Wikilinks wikitext text/x-wiki "'''Werte zählen'''..." erreicht man über das Nenü "Transformieren|Zählen...". Die Verwendungsmöglichkeiten dieser Funktion ähneln dem "[[Berechnen]]" für sehr einfache Aufgabenstellungen. "Zählen" erzeugt eine neue Variable, in der steht, wie oft ein bestimmter Wert oder Bereich aus mehreren anderen Variablen pro Fall (Zeile im Datensatz) aufgetreten ist. Die Bedienung der Funktion ähnelt dem [[Recodieren]] in andere Variablen. Man gibt zunächst Name und ggf. Label der Zielvariable an und dann, was die Funktion genau zählen soll. Auch hier kann man Bedingungen für die Ausführung der Funktion angeben. Das funktioniert genau wie unter [[Fälle auswählen]] beschrieben. Anwendungsbeispiel: Angenommen, man hat in einem Datensatz mehrere Likert-Skalen, die in ihren extremen Ausprägungen auf eine extreme politische Haltung hindeuten. Mit "Werte zählen..." kann man für jeden Befragten angeben, wie oft er einen dieser Extremismus-Indikatoren ausgewählt hat und mit diesen Werten in einer eigenen Variable weitere Berechnungen anstellen (z.B. Perzentile berechnen). [[Kategorie:SPSS-Kurs]] fb5728433225e5cc5ebcf4f6583adc5397013d41 Fälle auswählen 0 40 84 2019-04-17T11:57:24Z Trg 1 Wiederherstellung wikitext text/x-wiki '''Fälle auswählen'''... erreicht man über das Menü "Daten". Man kann damit Fälle aus dem Datensatz ausblenden oder löschen. ==Hauptmenü== Das Hauptmenü der Funktion "Fälle auswählen..." ermöglicht es, *Fälle nach einer bestimmten Bedingung auszuwählen *eine Zufallsstichprobe aus den Fällen zu ziehen *einen bestimmten Fall-Bereich auszuwählen *eine Variable des Datensatzes als Filterkriterium auszuwählen *einzustellen, ob die Fälle, die nicht ausgewählt sind, gefiltert (ausgeblendet) oder gelöscht (aus dem Datensatz entfernt) werden sollen. Meistens filtert man nur, weil die Daten normalerweise später wieder eingeblendet und weiter analysiert werden. c3cd2fb0ea5e809725f19b1fe3c10b22352cd61e 85 84 2019-04-17T11:59:50Z Trg 1 erweitert wikitext text/x-wiki '''Fälle auswählen'''... erreicht man über das Menü "Daten". Man kann damit Fälle aus dem Datensatz ausblenden oder löschen. ==Hauptmenü== Das Hauptmenü der Funktion "Fälle auswählen..." ermöglicht es, *Fälle nach einer bestimmten Bedingung auszuwählen *eine Zufallsstichprobe aus den Fällen zu ziehen *einen bestimmten Fall-Bereich auszuwählen *eine Variable des Datensatzes als Filterkriterium auszuwählen *einzustellen, ob die Fälle, die nicht ausgewählt sind, gefiltert (ausgeblendet) oder gelöscht (aus dem Datensatz entfernt) werden sollen. Meistens filtert man nur, weil die Daten normalerweise später wieder eingeblendet und weiter analysiert werden. ==Auswählen falls== Die wichtigste Funktion von "Fälle auswählen..." ist "Auswählen falls". Man erreicht das entsprechende Menü durch Klicken auf die Schaltfläche "Falls...". Links sieht man die Liste der zur Verfügung stehenden Variablen des Datensatzes. In das Feld oben rechts werden die Kriterien für die Fallauswahl geschrieben; das geschieht zum Teil über die Tastatur, zum Teil auch mit der eingeblendeten Operator-Tastatur. In dem Kästchen unten rechts können mathematische und logische Funktionen ausgewählt werden. '''Beispiel:''' Aktiv bleiben sollen nur Fälle, bei denen in der Variable Geschlecht (SEX) eine 1 steht und die Werte in der Variable ALTER größer als 22 sind (also nur Männer ab 23 Jahren). Eine solche Auswahl ist sinnvoll, wenn beispielsweise eine Untersuchung nur für eine bestimmte Zielgruppe durchgeführt werden soll. ===Operatoren und Funktionen=== Die Formel für die Auswahl der Fälle kann recht kompliziert ausfallen. Im folgenden werden zunächst die Operatoren und die wichtigsten Funktionen erklärt und dann einige Beispiele für komplexere Auswahldefinitionen beschrieben. + Plus < Kleiner als > Größer als - Minus <= Kleiner oder gleich >= Größer oder gleich * Mal (Multiplizieren) = Gleich ~= Nicht gleich / Durch (Dividieren) & Und | Oder ** Hoch (Potenzierung) ~ Nicht-Operator ( ) Klammern MISSING( ) In Klammern wird die Variable angegeben, die auf fehlende Werte (Missings) untersucht werden soll. ===Beispiele=== 1. Ausgewählt werden sollen Fälle, bei denen die Befragten Männer unter 26 oder Frauen über 24 waren: 6a3d7642dbb3fc4608abc00f8b03edb5a6932915 86 85 2019-04-17T12:00:29Z Trg 1 /* Beispiele */ Beispiel wikitext text/x-wiki '''Fälle auswählen'''... erreicht man über das Menü "Daten". Man kann damit Fälle aus dem Datensatz ausblenden oder löschen. ==Hauptmenü== Das Hauptmenü der Funktion "Fälle auswählen..." ermöglicht es, *Fälle nach einer bestimmten Bedingung auszuwählen *eine Zufallsstichprobe aus den Fällen zu ziehen *einen bestimmten Fall-Bereich auszuwählen *eine Variable des Datensatzes als Filterkriterium auszuwählen *einzustellen, ob die Fälle, die nicht ausgewählt sind, gefiltert (ausgeblendet) oder gelöscht (aus dem Datensatz entfernt) werden sollen. Meistens filtert man nur, weil die Daten normalerweise später wieder eingeblendet und weiter analysiert werden. ==Auswählen falls== Die wichtigste Funktion von "Fälle auswählen..." ist "Auswählen falls". Man erreicht das entsprechende Menü durch Klicken auf die Schaltfläche "Falls...". Links sieht man die Liste der zur Verfügung stehenden Variablen des Datensatzes. In das Feld oben rechts werden die Kriterien für die Fallauswahl geschrieben; das geschieht zum Teil über die Tastatur, zum Teil auch mit der eingeblendeten Operator-Tastatur. In dem Kästchen unten rechts können mathematische und logische Funktionen ausgewählt werden. '''Beispiel:''' Aktiv bleiben sollen nur Fälle, bei denen in der Variable Geschlecht (SEX) eine 1 steht und die Werte in der Variable ALTER größer als 22 sind (also nur Männer ab 23 Jahren). Eine solche Auswahl ist sinnvoll, wenn beispielsweise eine Untersuchung nur für eine bestimmte Zielgruppe durchgeführt werden soll. ===Operatoren und Funktionen=== Die Formel für die Auswahl der Fälle kann recht kompliziert ausfallen. Im folgenden werden zunächst die Operatoren und die wichtigsten Funktionen erklärt und dann einige Beispiele für komplexere Auswahldefinitionen beschrieben. + Plus < Kleiner als > Größer als - Minus <= Kleiner oder gleich >= Größer oder gleich * Mal (Multiplizieren) = Gleich ~= Nicht gleich / Durch (Dividieren) & Und | Oder ** Hoch (Potenzierung) ~ Nicht-Operator ( ) Klammern MISSING( ) In Klammern wird die Variable angegeben, die auf fehlende Werte (Missings) untersucht werden soll. ===Beispiele=== 1. Ausgewählt werden sollen Fälle, bei denen die Befragten Männer unter 26 oder Frauen über 24 waren: (SEX = 1 & ALTER < 26) | (Sex=2 & ALTER >=25) 2f3494394067948e657f9a14b24d360c27c8d088 87 86 2019-04-17T12:01:45Z Trg 1 /* Beispiele */ erweitert wikitext text/x-wiki '''Fälle auswählen'''... erreicht man über das Menü "Daten". Man kann damit Fälle aus dem Datensatz ausblenden oder löschen. ==Hauptmenü== Das Hauptmenü der Funktion "Fälle auswählen..." ermöglicht es, *Fälle nach einer bestimmten Bedingung auszuwählen *eine Zufallsstichprobe aus den Fällen zu ziehen *einen bestimmten Fall-Bereich auszuwählen *eine Variable des Datensatzes als Filterkriterium auszuwählen *einzustellen, ob die Fälle, die nicht ausgewählt sind, gefiltert (ausgeblendet) oder gelöscht (aus dem Datensatz entfernt) werden sollen. Meistens filtert man nur, weil die Daten normalerweise später wieder eingeblendet und weiter analysiert werden. ==Auswählen falls== Die wichtigste Funktion von "Fälle auswählen..." ist "Auswählen falls". Man erreicht das entsprechende Menü durch Klicken auf die Schaltfläche "Falls...". Links sieht man die Liste der zur Verfügung stehenden Variablen des Datensatzes. In das Feld oben rechts werden die Kriterien für die Fallauswahl geschrieben; das geschieht zum Teil über die Tastatur, zum Teil auch mit der eingeblendeten Operator-Tastatur. In dem Kästchen unten rechts können mathematische und logische Funktionen ausgewählt werden. '''Beispiel:''' Aktiv bleiben sollen nur Fälle, bei denen in der Variable Geschlecht (SEX) eine 1 steht und die Werte in der Variable ALTER größer als 22 sind (also nur Männer ab 23 Jahren). Eine solche Auswahl ist sinnvoll, wenn beispielsweise eine Untersuchung nur für eine bestimmte Zielgruppe durchgeführt werden soll. ===Operatoren und Funktionen=== Die Formel für die Auswahl der Fälle kann recht kompliziert ausfallen. Im folgenden werden zunächst die Operatoren und die wichtigsten Funktionen erklärt und dann einige Beispiele für komplexere Auswahldefinitionen beschrieben. + Plus < Kleiner als > Größer als - Minus <= Kleiner oder gleich >= Größer oder gleich * Mal (Multiplizieren) = Gleich ~= Nicht gleich / Durch (Dividieren) & Und | Oder ** Hoch (Potenzierung) ~ Nicht-Operator ( ) Klammern MISSING( ) In Klammern wird die Variable angegeben, die auf fehlende Werte (Missings) untersucht werden soll. ===Beispiele=== 1. Ausgewählt werden sollen Fälle, bei denen die Befragten Männer unter 26 oder Frauen über 24 waren: (SEX = 1 & ALTER < 26) | (Sex=2 & ALTER >=25) 2. Wie im vorherigen Beispiel, aber nur, wenn Angaben zur Meinung über die CDU gemacht wurden: ((SEX = 1 & ALTER < 26) | (Sex=2 & ALTER >=25))& ~MISSING(CDUMNG) 3. Wie im vorherigen Beispiel, aber nur, wenn die Angaben zur Meinung über die SPD fehlen: ((SEX = 1 & ALTER < 26) | (Sex=2 & ALTER >=25))& (~MISSING(CDUMNG)& MISSING(SPDMNG)) Es empfiehlt sich bei komplexeren Auswahldefinitionen im Datensatz zu prüfen, ob die Auswahl den gewünschten Erfolg hatte; bei Problemen hilft es oft, die Klammerausdrücke und die logischen Beziehungen von & und | genau zu überprüfen. 52b89e1fff2ad3f3a2e66d4cfe6814e3c2a27764 88 87 2019-04-17T12:03:33Z Trg 1 /* Beispiele */ erweitert, kat wikitext text/x-wiki '''Fälle auswählen'''... erreicht man über das Menü "Daten". Man kann damit Fälle aus dem Datensatz ausblenden oder löschen. ==Hauptmenü== Das Hauptmenü der Funktion "Fälle auswählen..." ermöglicht es, *Fälle nach einer bestimmten Bedingung auszuwählen *eine Zufallsstichprobe aus den Fällen zu ziehen *einen bestimmten Fall-Bereich auszuwählen *eine Variable des Datensatzes als Filterkriterium auszuwählen *einzustellen, ob die Fälle, die nicht ausgewählt sind, gefiltert (ausgeblendet) oder gelöscht (aus dem Datensatz entfernt) werden sollen. Meistens filtert man nur, weil die Daten normalerweise später wieder eingeblendet und weiter analysiert werden. ==Auswählen falls== Die wichtigste Funktion von "Fälle auswählen..." ist "Auswählen falls". Man erreicht das entsprechende Menü durch Klicken auf die Schaltfläche "Falls...". Links sieht man die Liste der zur Verfügung stehenden Variablen des Datensatzes. In das Feld oben rechts werden die Kriterien für die Fallauswahl geschrieben; das geschieht zum Teil über die Tastatur, zum Teil auch mit der eingeblendeten Operator-Tastatur. In dem Kästchen unten rechts können mathematische und logische Funktionen ausgewählt werden. '''Beispiel:''' Aktiv bleiben sollen nur Fälle, bei denen in der Variable Geschlecht (SEX) eine 1 steht und die Werte in der Variable ALTER größer als 22 sind (also nur Männer ab 23 Jahren). Eine solche Auswahl ist sinnvoll, wenn beispielsweise eine Untersuchung nur für eine bestimmte Zielgruppe durchgeführt werden soll. ===Operatoren und Funktionen=== Die Formel für die Auswahl der Fälle kann recht kompliziert ausfallen. Im folgenden werden zunächst die Operatoren und die wichtigsten Funktionen erklärt und dann einige Beispiele für komplexere Auswahldefinitionen beschrieben. + Plus < Kleiner als > Größer als - Minus <= Kleiner oder gleich >= Größer oder gleich * Mal (Multiplizieren) = Gleich ~= Nicht gleich / Durch (Dividieren) & Und | Oder ** Hoch (Potenzierung) ~ Nicht-Operator ( ) Klammern MISSING( ) In Klammern wird die Variable angegeben, die auf fehlende Werte (Missings) untersucht werden soll. ===Beispiele=== 1. Ausgewählt werden sollen Fälle, bei denen die Befragten Männer unter 26 oder Frauen über 24 waren: (SEX = 1 & ALTER < 26) | (Sex=2 & ALTER >=25) 2. Wie im vorherigen Beispiel, aber nur, wenn Angaben zur Meinung über die CDU gemacht wurden: ((SEX = 1 & ALTER < 26) | (Sex=2 & ALTER >=25))& ~MISSING(CDUMNG) 3. Wie im vorherigen Beispiel, aber nur, wenn die Angaben zur Meinung über die SPD fehlen: ((SEX = 1 & ALTER < 26) | (Sex=2 & ALTER >=25))& (~MISSING(CDUMNG)& MISSING(SPDMNG)) Es empfiehlt sich bei komplexeren Auswahldefinitionen im Datensatz zu prüfen, ob die Auswahl den gewünschten Erfolg hatte; bei Problemen hilft es oft, die Klammerausdrücke und die logischen Beziehungen von & und | genau zu überprüfen. ==Anwendungen== "Fälle auswählen" wird häufig verwendet, um eine Untersuchung auf bestimmte Fälle einzugrenzen, z.B. Befragte eines bestimmten Geschlechts und Alters, ggf. kombiniert mit anderen Merkmalen, wie Beruf oder politischer Präferenz. Bei Inhaltsanalysen können Untersuchungseinheiten mit besonderen Merkmalen für die weitere Analyse ausgewählt werden, z.B. Beiträge, in denen Angela Merkel und Gerhard Schröder gemeinsam vorkommen und die Grünen eine schlechte Bewertung erfahren. Eine andere Anwendung ist die [[Datenbereinigung]]. Wenn es bestimmte Fallkonstellationen nicht geben darf (z.B. Angela Merkel kommt in einem Beitrag gar nicht vor, wird aber als "sympathisch" bewertet) oder geben muß (wenn Gerhard Schröder erwähnt wird, muß auch ein Wert für seine Bewertung als "sympathisch" eingetragen sein), lässt sich das mit "Fälle auswählen..." gut ermitteln. Dazu ist insbesondere die Funktion MISSING( ), auch in Kombination mit ~ (= "nicht") wichtig. Die Funktion "Zufallsstichprobe" ermöglicht es aus großen Datensätzen kleinere zu machen oder aus einem Datensatz, der eine Grundgesamtheit enthält (z.B. alle Mitarbeiter einer Firma) eine Zufallsstichprobe zu ziehen. [[Kategorie:SPSS-Kurs]] 5cbc74cfde77e0db315b1fe8e0cdf5698cfd2757 Variable berechnen 0 41 89 2019-04-17T13:26:21Z Trg 1 Red. wikitext text/x-wiki #REDIRECT [[Berechnen]] d6a8d482d9e539edf2356a29f14d43669c3391ef Benutzer Diskussion:Trg 3 42 90 2019-04-17T13:27:32Z Trg 1 Red. wikitext text/x-wiki #REDIRECT [[Benutzer:Trg]] 4e3239fcd885f869a1294be71d49b7369958720d Kategorie:Statistik 14 43 93 2019-04-18T09:54:34Z Trg 1 angelegt wikitext text/x-wiki Seiten in der Kategorie "Statistik" gehören meist auch zur Kategorie "SPSS-Kurs" haben aber mindestens einen Schwerpunkt auf der Statistik im Unterschied zu dem Computerprogramm SPSS. cc04fbda060b9ecc9961457dd24aa8e32bbeb056 Perzentile 0 18 95 35 2019-04-18T09:55:34Z Trg 1 /* Weblinks */ +kat wikitext text/x-wiki '''Perzentile''' (können bei der Berechnung von [[Häufigkeitsauszählung]]en unter "Optionen" angefordert werden) sind Lagemaße für eine Verteilung von Objekten. Dazu werden die Objekte, z.B. befragte Personen, nach der Ausprägung einer Variablen (z.B. dem Alter) geordnet. In dem Beispieldatensatz, mit dem die Screenshots erstellt wurden, gibt es eine Variable "Alter". Für die folgenden Beispiele der Perzentilberechnungen müssen die "Befragten" zunächst nach dem interessierenden Merkmal "Alter" sortiert werden (in Wirklichkeit macht SPSS das automatisch im Hintergrund, das Verfahren wird hier lediglich zur Illustration genau erklärt). 20; 20; 21; 21; 22; 22; 22; 22; 22; 22; 22; 23; 23; 24; 26; 26; 29; 29; 31; 31 ==Median== Der Median wird meist als Lagemaß im Zusammenhang mit dem Mittelwert genannt, ist aber eigentlich nur ein spezieller Perzentilwert. Er gibt an, welcher Wert sich in der Mitte der geordneten Wertereihe befindet. Im Beispiel oben ist das die 22 (links und rechts der Mitte steht 22 als Altersangabe). ==Quartile== Der Median wird meist als Lagemaß im Zusammenhang mit dem Mittelwert genannt, ist aber eigentlich nur ein spezieller Perzentilwert. Er gibt an, welcher Wert sich in der Mitte der geordneten Wertereihe befindet. Im Beispiel oben ist das die 22 (links und rechts der Mitte steht 22 als Altersangabe). ==Dezile== SPSS berechnet auch andere Werte, beispielsweise den Perzentilwert für 90 Prozent der geordneten Wertereihe. Er beträgt hier 30,8 (siehe Abbildung) und kann nicht mehr anschaulich aus der Reihe abgeleitet werden, hier muß der Nutzer sich auf die Ausgabe von SPSS verlassen. ==Weblinks== *Median bei de.wikipedia.org https://de.wikipedia.org/wiki/Median [[Kategorie:SPSS-Kurs]] [[Kategorie:Statistik]] 0f0fed03f7e69f34cf0c089b8a59a243d4506c87 Kreuztabellen 0 24 99 47 2019-05-13T13:31:14Z Trg 1 - wikitext text/x-wiki Kreuztabellen geben bei der Analyse eines Datensatzes Auskunft über Zusammenhänge zwischen Variablen. Manchmal wird die Kreuztabelle auch nur als Werkzeug verwendet, um Daten zu vergleichen oder aufzubereiten, beispielsweise für Darstellungen im Zeitverlauf oder bei der [[Datenbereinigung]]. Kreuztablellen bestehen in der Regel aus einem Tabellenkopf, der die Spaltenbeschriftungen enthält und einer linken Randspalte, die die Zeilenbeschriftungen enthält. Wenn es sinnvoll möglich ist, werden die Summen der Spalten in der untersten Zeile aufgelistet, die Summen der Zeilen in der rechten Randspalte. Eine Kreuztabelle soll außerdem eine aussagekräftige Überschrift haben und ggf. Fußnoten, die Besonderheiten der Tabelle für den Leser nachvollziehbar erläutern. Fast immer stehen im Kopf der Tabellen die unabhängigen Variablen, also die, von denen man annimmt, daß sie auf andere Variablen wirken. Diese abhängigen Variablen stehen dann in den Zeilen der Tabelle. ==Kreuztabellen bei SPSS== ===Das Menü "Deskriptive Statistiken|Kreuztabellen..."=== Kreuztabellen erzeugt man mit SPSS am einfachsten über das Menü "Analysieren|Deskriptive Statistiken|Kreuztabellen..."; das Menü "Analysieren|Tabellen..." ist für kompliziertere oder spezielle Tabellen gedacht und wird hier zunächst nicht besprochen. Im Menü "Kreuztabellen..." steht links zunächst die Variablenliste. Rechts kann man den Variablen ihre Positionen in der Tabelle zuweisen: #Zeilen: Abhängige Variablen werden in der Regel in den Zeilen (quer) angeordnet. Manchmal kann es - vor allem bei einer großen Anzahl von Variablenausprägungen, z.B. bei Themenlisten für die Inhaltsanalyse - jedoch auch nötig sein, die unabhängige Variable in die Zeilen zu schreiben. #Spalten: Hier ist normalerweise der Platz für die unabhängige Variable in einer Tabelle (vertikal, die Ausprägungen der unabhängigen Variablen stehen im Kopf der Tabelle). #Schichten: Mit Hilfe einer Schichtung kann man getrennte Kreuztabellen für die Ausprägungen einer dritten Variablen erstellen lassen. Eine solche Drittvariablenkontrolle dient der Überprüfung vermuteter Scheinkorrelationen. ===Das Untermenü "Zellen..."=== Bei Kreuztabellen-Analysen ist das Untermenü "Zellen..." das wichtigste Einstellungswerkzeug. Es ermöglicht festzulegen, wie die Werte für die Kreuztabelle berechnet werden, was für die Interpretation der Daten entscheidend ist. Die für übliche Analysen relevanten Optionen sind: *'''Häufigkeiten''': "Beobachtet" bedeutet, daß die tatsächlich im Datensatz vorkommenden Zahlen, wie sie auch in einer Häufigkeitsauszählung stehen, in die Tabellenzellen geschrieben werden. "Erwartet" bedeutet, daß (meist zusätzlich) die Häufigkeiten angegeben werden, die statistisch bei einer Zufallsverteilung der Daten zu erwarten wären. *'''Prozentwerte''': Bei einer zeilenweisen Berechnung von Prozentwerten, ergeben die Zahlen in einer Zeile zusammen 100 Prozent. Bei der spaltenweisen Berechnung, ergeben die Zahlen einer Spalte zusammen 100 Prozent. Steht die unabhängige Variable im Kopf, ist fast immer auch die spaltenweise Prozentuierung sinnvoll. Bei einer Gesamtprozentuierung wird in jede Zelle eingetragen, wieviel Prozent der Zelleninhalt ausmacht, wenn die gesamte Tabelle 100 Prozent repräsentiert. Diese Einstellung wird unter anderem für Paneluntersuchungen gebraucht. *'''Residuen''' werden für den Vergleich von Erwartungswert und beobachtetem Wert gebraucht. *'''Gewichtungsfaktoren''' erleichtern die Arbeit mit Bruchwerten für Fälle bei Kreuztabellen in gewichteten Datensätzen. ===Weitere Untermenüs=== *Exakt...: Hiermit können sog. exakte Tests durchgeführt werden, um das Signifikanzniveau von Korrelationen zu untersuchen. Diese Funktion steht nicht in allen SPSS-Versionen zur Verfügung. *Statistik... ermöglicht die Berechnung von allerhand Korrelationskoeffizienten (siehe dort). *Format... dient der Einstellung des Tabellenaufbaus. [[Kategorie:SPSS-Kurs]] 55591158e7fe1c6895f3474f57848ddcc91c6f21 102 99 2019-05-20T06:31:21Z Trg 1 ss wikitext text/x-wiki Kreuztabellen geben bei der Analyse eines Datensatzes Auskunft über Zusammenhänge zwischen Variablen. Manchmal wird die Kreuztabelle auch nur als Werkzeug verwendet, um Daten zu vergleichen oder aufzubereiten, beispielsweise für Darstellungen im Zeitverlauf oder bei der [[Datenbereinigung]]. Kreuztablellen bestehen in der Regel aus einem Tabellenkopf, der die Spaltenbeschriftungen enthält und einer linken Randspalte, die die Zeilenbeschriftungen enthält. Wenn es sinnvoll möglich ist, werden die Summen der Spalten in der untersten Zeile aufgelistet, die Summen der Zeilen in der rechten Randspalte. Eine Kreuztabelle soll außerdem eine aussagekräftige Überschrift haben und ggf. Fußnoten, die Besonderheiten der Tabelle für den Leser nachvollziehbar erläutern. Fast immer stehen im Kopf der Tabellen die unabhängigen Variablen, also die, von denen man annimmt, dass sie auf andere Variablen wirken. Diese abhängigen Variablen stehen dann in den Zeilen der Tabelle. ==Kreuztabellen bei SPSS== ===Das Menü "Deskriptive Statistiken|Kreuztabellen..."=== Kreuztabellen erzeugt man mit SPSS am einfachsten über das Menü "Analysieren|Deskriptive Statistiken|Kreuztabellen..."; das Menü "Analysieren|Tabellen..." ist für kompliziertere oder spezielle Tabellen gedacht und wird hier zunächst nicht besprochen. Im Menü "Kreuztabellen..." steht links zunächst die Variablenliste. Rechts kann man den Variablen ihre Positionen in der Tabelle zuweisen: #Zeilen: Abhängige Variablen werden in der Regel in den Zeilen (quer) angeordnet. Manchmal kann es - vor allem bei einer großen Anzahl von Variablenausprägungen, z.B. bei Themenlisten für die Inhaltsanalyse - jedoch auch nötig sein, die unabhängige Variable in die Zeilen zu schreiben. #Spalten: Hier ist normalerweise der Platz für die unabhängige Variable in einer Tabelle (vertikal, die Ausprägungen der unabhängigen Variablen stehen im Kopf der Tabelle). #Schichten: Mit Hilfe einer Schichtung kann man getrennte Kreuztabellen für die Ausprägungen einer dritten Variablen erstellen lassen. Eine solche Drittvariablenkontrolle dient der Überprüfung vermuteter Scheinkorrelationen. ===Das Untermenü "Zellen..."=== Bei Kreuztabellen-Analysen ist das Untermenü "Zellen..." das wichtigste Einstellungswerkzeug. Es ermöglicht festzulegen, wie die Werte für die Kreuztabelle berechnet werden, was für die Interpretation der Daten entscheidend ist. Die für übliche Analysen relevanten Optionen sind: *'''Häufigkeiten''': "Beobachtet" bedeutet, daß die tatsächlich im Datensatz vorkommenden Zahlen, wie sie auch in einer Häufigkeitsauszählung stehen, in die Tabellenzellen geschrieben werden. "Erwartet" bedeutet, daß (meist zusätzlich) die Häufigkeiten angegeben werden, die statistisch bei einer Zufallsverteilung der Daten zu erwarten wären. *'''Prozentwerte''': Bei einer zeilenweisen Berechnung von Prozentwerten, ergeben die Zahlen in einer Zeile zusammen 100 Prozent. Bei der spaltenweisen Berechnung, ergeben die Zahlen einer Spalte zusammen 100 Prozent. Steht die unabhängige Variable im Kopf, ist fast immer auch die spaltenweise Prozentuierung sinnvoll. Bei einer Gesamtprozentuierung wird in jede Zelle eingetragen, wieviel Prozent der Zelleninhalt ausmacht, wenn die gesamte Tabelle 100 Prozent repräsentiert. Diese Einstellung wird unter anderem für Paneluntersuchungen gebraucht. *'''Residuen''' werden für den Vergleich von Erwartungswert und beobachtetem Wert gebraucht. *'''Gewichtungsfaktoren''' erleichtern die Arbeit mit Bruchwerten für Fälle bei Kreuztabellen in gewichteten Datensätzen. ===Weitere Untermenüs=== *Exakt...: Hiermit können sog. exakte Tests durchgeführt werden, um das Signifikanzniveau von Korrelationen zu untersuchen. Diese Funktion steht nicht in allen SPSS-Versionen zur Verfügung. *Statistik... ermöglicht die Berechnung von allerhand Korrelationskoeffizienten (siehe dort). *Format... dient der Einstellung des Tabellenaufbaus. [[Kategorie:SPSS-Kurs]] 3b4c7d05b53793baa6acf454a5cdc74cfd93ae53 Kategorie:SPSS-Kurs 14 8 103 14 2019-05-20T06:50:12Z Trg 1 /* SPSS */ erg. wikitext text/x-wiki ==SPSS== <strike>Der Wiederaufbau der Seiten wird einige Zeit dauern (2019-04-13).</strike> Der Wiederaufbau ist weitgehend abgeschlossen, aber mit weniger Grafiken als früher (2019-05-19) ae524446ce27b8544af7f544548291b8630357df Q-Q-Diagramm 0 44 104 2019-06-27T11:43:34Z Trg 1 Redirect wikitext text/x-wiki #REDIRECT [[Test auf Normalverteilung]] bebaf16868f07b701e9af91e5b2c82d18cff714b Kolmogorov-Smirnov-Test 0 45 105 2019-06-27T11:44:37Z Trg 1 Redirect wikitext text/x-wiki #REDIRECT [[Test auf Normalverteilung]] bebaf16868f07b701e9af91e5b2c82d18cff714b Shapiro-Wilk-Test 0 46 106 2019-06-27T11:45:21Z Trg 1 Redirect wikitext text/x-wiki #REDIRECT [[Test auf Normalverteilung]] bebaf16868f07b701e9af91e5b2c82d18cff714b Datei:Kreuztabelle.jpg 6 47 107 2019-07-05T13:16:48Z Trg 1 Kepplinger, Hans Mathias in Zusammenarbeit mit Marcus Maurer und Thomas Roessing (1999): Deutschland vor der Wahl. Eine Frame-Analyse der Fernsehnachrichten. In: Elisabeth Noelle-Neumann / Hans Mathias Kepplinger / Wolfgang Donsbach (Hrsg.): Kampa. Mei… wikitext text/x-wiki == Beschreibung == Kepplinger, Hans Mathias in Zusammenarbeit mit Marcus Maurer und Thomas Roessing (1999): Deutschland vor der Wahl. Eine Frame-Analyse der Fernsehnachrichten. In: Elisabeth Noelle-Neumann / Hans Mathias Kepplinger / Wolfgang Donsbach (Hrsg.): Kampa. Meinungsklima und Medienwirkung im Bundestagswahlkampf 1998. Freiburg, München: Alber. S. 78-107. Hier S. 97. 01df8c40112257070b33fae4af9a3d17fce73ee3 Kreuztabellen 0 24 108 102 2019-07-05T13:29:06Z Trg 1 Ergänzt wikitext text/x-wiki Kreuztabellen geben bei der Analyse eines Datensatzes Auskunft über Zusammenhänge zwischen Variablen. Manchmal wird die Kreuztabelle auch nur als Werkzeug verwendet, um Daten zu vergleichen oder aufzubereiten, beispielsweise für Darstellungen im Zeitverlauf oder bei der [[Datenbereinigung]]. Kreuztablellen bestehen in der Regel aus einem Tabellenkopf, der die Spaltenbeschriftungen enthält und einer linken Randspalte, die die Zeilenbeschriftungen enthält. Wenn es sinnvoll möglich ist, werden die Summen der Spalten in der untersten Zeile aufgelistet, die Summen der Zeilen in der rechten Randspalte. Eine Kreuztabelle soll außerdem eine aussagekräftige Überschrift haben und ggf. Fußnoten, die Besonderheiten der Tabelle für den Leser nachvollziehbar erläutern. Fast immer stehen im Kopf der Tabellen die unabhängigen Variablen, also die, von denen man annimmt, dass sie auf andere Variablen wirken. Diese abhängigen Variablen stehen dann in den Zeilen der Tabelle. ==Beispiel== [[Datei:Kreuztabelle.jpg|mini|Kreuztabelle]] Diese Kreuztabelle (vgl. Kepplinger, Hans Mathias in Zusammenarbeit mit Marcus Maurer und Thomas Roessing [1999]: Deutschland vor der Wahl. Eine Frame-Analyse der Fernsehnachrichten. In: Elisabeth Noelle-Neumann / Hans Mathias Kepplinger / Wolfgang Donsbach (Hrsg.): Kampa. Meinungsklima und Medienwirkung im Bundestagswahlkampf 1998. Freiburg, München: Alber. S. 78-107.) stammt von einer Inhaltsanalyse zum Bundestagswahlkampf 1999. Dort wurde erhoben, ob bei Sachthemen die individuellen Ansprüche der Menschen, doer die Leistungskraft der Institutionen (z.B. Finanzierung des Arbeitslosengeldes) im Vordergrund stehen und wie CDU/CSU und SPD in diesen Beiträgen bewertet werden. Die Tabelle zeigt, dass, wenn in einem Beitrag die institutionelle Leistungskraft im Vordergrund steht, CDU/CSU und SPD ungefähr gleich bewertet werden. Stehen hingegen die individuellen Ansprüche der Menschen im Vordergrund, wird die SPD viel öfter positiv bewertet als die CDU/CSU. Da zudem die individuellen Ansprüche öfter den Blickwinkel der Beiträge bestimmen (Framing) als die institutionelle Leistungskraft: Vorteil für die Sozialdemokraten in der Berichterstattung! ==Kreuztabellen bei SPSS== ===Das Menü "Deskriptive Statistiken|Kreuztabellen..."=== Kreuztabellen erzeugt man mit SPSS am einfachsten über das Menü "Analysieren|Deskriptive Statistiken|Kreuztabellen..."; das Menü "Analysieren|Tabellen..." ist für kompliziertere oder spezielle Tabellen gedacht und wird hier zunächst nicht besprochen. Im Menü "Kreuztabellen..." steht links zunächst die Variablenliste. Rechts kann man den Variablen ihre Positionen in der Tabelle zuweisen: #Zeilen: Abhängige Variablen werden in der Regel in den Zeilen (quer) angeordnet. Manchmal kann es - vor allem bei einer großen Anzahl von Variablenausprägungen, z.B. bei Themenlisten für die Inhaltsanalyse - jedoch auch nötig sein, die unabhängige Variable in die Zeilen zu schreiben. #Spalten: Hier ist normalerweise der Platz für die unabhängige Variable in einer Tabelle (vertikal, die Ausprägungen der unabhängigen Variablen stehen im Kopf der Tabelle). #Schichten: Mit Hilfe einer Schichtung kann man getrennte Kreuztabellen für die Ausprägungen einer dritten Variablen erstellen lassen. Eine solche Drittvariablenkontrolle dient der Überprüfung vermuteter Scheinkorrelationen. ===Das Untermenü "Zellen..."=== Bei Kreuztabellen-Analysen ist das Untermenü "Zellen..." das wichtigste Einstellungswerkzeug. Es ermöglicht festzulegen, wie die Werte für die Kreuztabelle berechnet werden, was für die Interpretation der Daten entscheidend ist. Die für übliche Analysen relevanten Optionen sind: *'''Häufigkeiten''': "Beobachtet" bedeutet, daß die tatsächlich im Datensatz vorkommenden Zahlen, wie sie auch in einer Häufigkeitsauszählung stehen, in die Tabellenzellen geschrieben werden. "Erwartet" bedeutet, daß (meist zusätzlich) die Häufigkeiten angegeben werden, die statistisch bei einer Zufallsverteilung der Daten zu erwarten wären. *'''Prozentwerte''': Bei einer zeilenweisen Berechnung von Prozentwerten, ergeben die Zahlen in einer Zeile zusammen 100 Prozent. Bei der spaltenweisen Berechnung, ergeben die Zahlen einer Spalte zusammen 100 Prozent. Steht die unabhängige Variable im Kopf, ist fast immer auch die spaltenweise Prozentuierung sinnvoll. Bei einer Gesamtprozentuierung wird in jede Zelle eingetragen, wieviel Prozent der Zelleninhalt ausmacht, wenn die gesamte Tabelle 100 Prozent repräsentiert. Diese Einstellung wird unter anderem für Paneluntersuchungen gebraucht. *'''Residuen''' werden für den Vergleich von Erwartungswert und beobachtetem Wert gebraucht. *'''Gewichtungsfaktoren''' erleichtern die Arbeit mit Bruchwerten für Fälle bei Kreuztabellen in gewichteten Datensätzen. ===Weitere Untermenüs=== *Exakt...: Hiermit können sog. exakte Tests durchgeführt werden, um das Signifikanzniveau von Korrelationen zu untersuchen. Diese Funktion steht nicht in allen SPSS-Versionen zur Verfügung. *Statistik... ermöglicht die Berechnung von allerhand Korrelationskoeffizienten (siehe dort). *Format... dient der Einstellung des Tabellenaufbaus. ==Belege== <references /> [[Kategorie:SPSS-Kurs]] 13eaf0f7dd44081d5f3d7b1a75cd006707215eaa 109 108 2019-07-05T13:29:34Z Trg 1 korr. wikitext text/x-wiki Kreuztabellen geben bei der Analyse eines Datensatzes Auskunft über Zusammenhänge zwischen Variablen. Manchmal wird die Kreuztabelle auch nur als Werkzeug verwendet, um Daten zu vergleichen oder aufzubereiten, beispielsweise für Darstellungen im Zeitverlauf oder bei der [[Datenbereinigung]]. Kreuztablellen bestehen in der Regel aus einem Tabellenkopf, der die Spaltenbeschriftungen enthält und einer linken Randspalte, die die Zeilenbeschriftungen enthält. Wenn es sinnvoll möglich ist, werden die Summen der Spalten in der untersten Zeile aufgelistet, die Summen der Zeilen in der rechten Randspalte. Eine Kreuztabelle soll außerdem eine aussagekräftige Überschrift haben und ggf. Fußnoten, die Besonderheiten der Tabelle für den Leser nachvollziehbar erläutern. Fast immer stehen im Kopf der Tabellen die unabhängigen Variablen, also die, von denen man annimmt, dass sie auf andere Variablen wirken. Diese abhängigen Variablen stehen dann in den Zeilen der Tabelle. ==Beispiel== [[Datei:Kreuztabelle.jpg|mini|Kreuztabelle]] Diese Kreuztabelle (vgl. Kepplinger, Hans Mathias in Zusammenarbeit mit Marcus Maurer und Thomas Roessing [1999]: Deutschland vor der Wahl. Eine Frame-Analyse der Fernsehnachrichten. In: Elisabeth Noelle-Neumann / Hans Mathias Kepplinger / Wolfgang Donsbach (Hrsg.): Kampa. Meinungsklima und Medienwirkung im Bundestagswahlkampf 1998. Freiburg, München: Alber. S. 78-107.) stammt von einer Inhaltsanalyse zum Bundestagswahlkampf 1999. Dort wurde erhoben, ob bei Sachthemen die individuellen Ansprüche der Menschen, doer die Leistungskraft der Institutionen (z.B. Finanzierung des Arbeitslosengeldes) im Vordergrund stehen und wie CDU/CSU und SPD in diesen Beiträgen bewertet werden. Die Tabelle zeigt, dass, wenn in einem Beitrag die institutionelle Leistungskraft im Vordergrund steht, CDU/CSU und SPD ungefähr gleich bewertet werden. Stehen hingegen die individuellen Ansprüche der Menschen im Vordergrund, wird die SPD viel öfter positiv bewertet als die CDU/CSU. Da zudem die individuellen Ansprüche öfter den Blickwinkel der Beiträge bestimmen (Framing) als die institutionelle Leistungskraft: Vorteil für die Sozialdemokraten in der Berichterstattung! ==Kreuztabellen bei SPSS== ===Das Menü "Deskriptive Statistiken|Kreuztabellen..."=== Kreuztabellen erzeugt man mit SPSS am einfachsten über das Menü "Analysieren|Deskriptive Statistiken|Kreuztabellen..."; das Menü "Analysieren|Tabellen..." ist für kompliziertere oder spezielle Tabellen gedacht und wird hier zunächst nicht besprochen. Im Menü "Kreuztabellen..." steht links zunächst die Variablenliste. Rechts kann man den Variablen ihre Positionen in der Tabelle zuweisen: #Zeilen: Abhängige Variablen werden in der Regel in den Zeilen (quer) angeordnet. Manchmal kann es - vor allem bei einer großen Anzahl von Variablenausprägungen, z.B. bei Themenlisten für die Inhaltsanalyse - jedoch auch nötig sein, die unabhängige Variable in die Zeilen zu schreiben. #Spalten: Hier ist normalerweise der Platz für die unabhängige Variable in einer Tabelle (vertikal, die Ausprägungen der unabhängigen Variablen stehen im Kopf der Tabelle). #Schichten: Mit Hilfe einer Schichtung kann man getrennte Kreuztabellen für die Ausprägungen einer dritten Variablen erstellen lassen. Eine solche Drittvariablenkontrolle dient der Überprüfung vermuteter Scheinkorrelationen. ===Das Untermenü "Zellen..."=== Bei Kreuztabellen-Analysen ist das Untermenü "Zellen..." das wichtigste Einstellungswerkzeug. Es ermöglicht festzulegen, wie die Werte für die Kreuztabelle berechnet werden, was für die Interpretation der Daten entscheidend ist. Die für übliche Analysen relevanten Optionen sind: *'''Häufigkeiten''': "Beobachtet" bedeutet, daß die tatsächlich im Datensatz vorkommenden Zahlen, wie sie auch in einer Häufigkeitsauszählung stehen, in die Tabellenzellen geschrieben werden. "Erwartet" bedeutet, daß (meist zusätzlich) die Häufigkeiten angegeben werden, die statistisch bei einer Zufallsverteilung der Daten zu erwarten wären. *'''Prozentwerte''': Bei einer zeilenweisen Berechnung von Prozentwerten, ergeben die Zahlen in einer Zeile zusammen 100 Prozent. Bei der spaltenweisen Berechnung, ergeben die Zahlen einer Spalte zusammen 100 Prozent. Steht die unabhängige Variable im Kopf, ist fast immer auch die spaltenweise Prozentuierung sinnvoll. Bei einer Gesamtprozentuierung wird in jede Zelle eingetragen, wieviel Prozent der Zelleninhalt ausmacht, wenn die gesamte Tabelle 100 Prozent repräsentiert. Diese Einstellung wird unter anderem für Paneluntersuchungen gebraucht. *'''Residuen''' werden für den Vergleich von Erwartungswert und beobachtetem Wert gebraucht. *'''Gewichtungsfaktoren''' erleichtern die Arbeit mit Bruchwerten für Fälle bei Kreuztabellen in gewichteten Datensätzen. ===Weitere Untermenüs=== *Exakt...: Hiermit können sog. exakte Tests durchgeführt werden, um das Signifikanzniveau von Korrelationen zu untersuchen. Diese Funktion steht nicht in allen SPSS-Versionen zur Verfügung. *Statistik... ermöglicht die Berechnung von allerhand Korrelationskoeffizienten (siehe dort). *Format... dient der Einstellung des Tabellenaufbaus. [[Kategorie:SPSS-Kurs]] 3848d517076b3453055197aee55dce9510936059 110 109 2019-07-05T13:30:54Z Trg 1 kl. wikitext text/x-wiki '''Kreuztabellen''' geben bei der Analyse eines Datensatzes Auskunft über Zusammenhänge zwischen Variablen. Manchmal wird die Kreuztabelle auch nur als Werkzeug verwendet, um Daten zu vergleichen oder aufzubereiten, beispielsweise für Darstellungen im Zeitverlauf oder bei der [[Datenbereinigung]]. Kreuztablellen bestehen in der Regel aus einem Tabellenkopf, der die Spaltenbeschriftungen enthält und einer linken Randspalte, die die Zeilenbeschriftungen enthält. Wenn es sinnvoll möglich ist, werden die Summen der Spalten in der untersten Zeile aufgelistet, die Summen der Zeilen in der rechten Randspalte. Eine Kreuztabelle soll außerdem eine aussagekräftige Überschrift haben und ggf. Fußnoten, die Besonderheiten der Tabelle für den Leser nachvollziehbar erläutern. Fast immer stehen im Kopf der Tabellen die unabhängigen Variablen, also die, von denen man annimmt, dass sie auf andere Variablen wirken. Diese abhängigen Variablen stehen dann in den Zeilen der Tabelle. ==Beispiel== [[Datei:Kreuztabelle.jpg|left|mini|Kreuztabelle]] Diese Kreuztabelle (vgl. Kepplinger, Hans Mathias in Zusammenarbeit mit Marcus Maurer und Thomas Roessing [1999]: Deutschland vor der Wahl. Eine Frame-Analyse der Fernsehnachrichten. In: Elisabeth Noelle-Neumann / Hans Mathias Kepplinger / Wolfgang Donsbach (Hrsg.): Kampa. Meinungsklima und Medienwirkung im Bundestagswahlkampf 1998. Freiburg, München: Alber. S. 78-107.) stammt von einer Inhaltsanalyse zum Bundestagswahlkampf 1999. Dort wurde erhoben, ob bei Sachthemen die individuellen Ansprüche der Menschen, doer die Leistungskraft der Institutionen (z.B. Finanzierung des Arbeitslosengeldes) im Vordergrund stehen und wie CDU/CSU und SPD in diesen Beiträgen bewertet werden. Die Tabelle zeigt, dass, wenn in einem Beitrag die institutionelle Leistungskraft im Vordergrund steht, CDU/CSU und SPD ungefähr gleich bewertet werden. Stehen hingegen die individuellen Ansprüche der Menschen im Vordergrund, wird die SPD viel öfter positiv bewertet als die CDU/CSU. Da zudem die individuellen Ansprüche öfter den Blickwinkel der Beiträge bestimmen (Framing) als die institutionelle Leistungskraft: Vorteil für die Sozialdemokraten in der Berichterstattung! ==Kreuztabellen bei SPSS== ===Das Menü "Deskriptive Statistiken|Kreuztabellen..."=== Kreuztabellen erzeugt man mit SPSS am einfachsten über das Menü "Analysieren|Deskriptive Statistiken|Kreuztabellen..."; das Menü "Analysieren|Tabellen..." ist für kompliziertere oder spezielle Tabellen gedacht und wird hier zunächst nicht besprochen. Im Menü "Kreuztabellen..." steht links zunächst die Variablenliste. Rechts kann man den Variablen ihre Positionen in der Tabelle zuweisen: #Zeilen: Abhängige Variablen werden in der Regel in den Zeilen (quer) angeordnet. Manchmal kann es - vor allem bei einer großen Anzahl von Variablenausprägungen, z.B. bei Themenlisten für die Inhaltsanalyse - jedoch auch nötig sein, die unabhängige Variable in die Zeilen zu schreiben. #Spalten: Hier ist normalerweise der Platz für die unabhängige Variable in einer Tabelle (vertikal, die Ausprägungen der unabhängigen Variablen stehen im Kopf der Tabelle). #Schichten: Mit Hilfe einer Schichtung kann man getrennte Kreuztabellen für die Ausprägungen einer dritten Variablen erstellen lassen. Eine solche Drittvariablenkontrolle dient der Überprüfung vermuteter Scheinkorrelationen. ===Das Untermenü "Zellen..."=== Bei Kreuztabellen-Analysen ist das Untermenü "Zellen..." das wichtigste Einstellungswerkzeug. Es ermöglicht festzulegen, wie die Werte für die Kreuztabelle berechnet werden, was für die Interpretation der Daten entscheidend ist. Die für übliche Analysen relevanten Optionen sind: *'''Häufigkeiten''': "Beobachtet" bedeutet, daß die tatsächlich im Datensatz vorkommenden Zahlen, wie sie auch in einer Häufigkeitsauszählung stehen, in die Tabellenzellen geschrieben werden. "Erwartet" bedeutet, daß (meist zusätzlich) die Häufigkeiten angegeben werden, die statistisch bei einer Zufallsverteilung der Daten zu erwarten wären. *'''Prozentwerte''': Bei einer zeilenweisen Berechnung von Prozentwerten, ergeben die Zahlen in einer Zeile zusammen 100 Prozent. Bei der spaltenweisen Berechnung, ergeben die Zahlen einer Spalte zusammen 100 Prozent. Steht die unabhängige Variable im Kopf, ist fast immer auch die spaltenweise Prozentuierung sinnvoll. Bei einer Gesamtprozentuierung wird in jede Zelle eingetragen, wieviel Prozent der Zelleninhalt ausmacht, wenn die gesamte Tabelle 100 Prozent repräsentiert. Diese Einstellung wird unter anderem für Paneluntersuchungen gebraucht. *'''Residuen''' werden für den Vergleich von Erwartungswert und beobachtetem Wert gebraucht. *'''Gewichtungsfaktoren''' erleichtern die Arbeit mit Bruchwerten für Fälle bei Kreuztabellen in gewichteten Datensätzen. ===Weitere Untermenüs=== *Exakt...: Hiermit können sog. exakte Tests durchgeführt werden, um das Signifikanzniveau von Korrelationen zu untersuchen. Diese Funktion steht nicht in allen SPSS-Versionen zur Verfügung. *Statistik... ermöglicht die Berechnung von allerhand Korrelationskoeffizienten (siehe dort). *Format... dient der Einstellung des Tabellenaufbaus. [[Kategorie:SPSS-Kurs]] 54a3ee3122f43416e7aa72ad576f789b5fd216f1 111 110 2019-07-19T11:13:47Z Trg 1 /* Beispiel */ kl. Korr. wikitext text/x-wiki '''Kreuztabellen''' geben bei der Analyse eines Datensatzes Auskunft über Zusammenhänge zwischen Variablen. Manchmal wird die Kreuztabelle auch nur als Werkzeug verwendet, um Daten zu vergleichen oder aufzubereiten, beispielsweise für Darstellungen im Zeitverlauf oder bei der [[Datenbereinigung]]. Kreuztablellen bestehen in der Regel aus einem Tabellenkopf, der die Spaltenbeschriftungen enthält und einer linken Randspalte, die die Zeilenbeschriftungen enthält. Wenn es sinnvoll möglich ist, werden die Summen der Spalten in der untersten Zeile aufgelistet, die Summen der Zeilen in der rechten Randspalte. Eine Kreuztabelle soll außerdem eine aussagekräftige Überschrift haben und ggf. Fußnoten, die Besonderheiten der Tabelle für den Leser nachvollziehbar erläutern. Fast immer stehen im Kopf der Tabellen die unabhängigen Variablen, also die, von denen man annimmt, dass sie auf andere Variablen wirken. Diese abhängigen Variablen stehen dann in den Zeilen der Tabelle. ==Beispiel== [[Datei:Kreuztabelle.jpg|left|mini|Kreuztabelle]] Diese Kreuztabelle (vgl. Kepplinger, Hans Mathias in Zusammenarbeit mit Marcus Maurer und Thomas Roessing [1999]: Deutschland vor der Wahl. Eine Frame-Analyse der Fernsehnachrichten. In: Elisabeth Noelle-Neumann / Hans Mathias Kepplinger / Wolfgang Donsbach (Hrsg.): Kampa. Meinungsklima und Medienwirkung im Bundestagswahlkampf 1998. Freiburg, München: Alber. S. 78-107.) stammt von einer Inhaltsanalyse zum Bundestagswahlkampf 1998. Dort wurde erhoben, ob bei Sachthemen die individuellen Ansprüche der Menschen, doer die Leistungskraft der Institutionen (z.B. Finanzierung des Arbeitslosengeldes) im Vordergrund stehen und wie CDU/CSU und SPD in diesen Beiträgen bewertet werden. Die Tabelle zeigt, dass, wenn in einem Beitrag die institutionelle Leistungskraft im Vordergrund steht, CDU/CSU und SPD ungefähr gleich bewertet werden. Stehen hingegen die individuellen Ansprüche der Menschen im Vordergrund, wird die SPD viel öfter positiv bewertet als die CDU/CSU. Da zudem die individuellen Ansprüche öfter den Blickwinkel der Beiträge bestimmen (Framing) als die institutionelle Leistungskraft: Vorteil für die Sozialdemokraten in der Berichterstattung! ==Kreuztabellen bei SPSS== ===Das Menü "Deskriptive Statistiken|Kreuztabellen..."=== Kreuztabellen erzeugt man mit SPSS am einfachsten über das Menü "Analysieren|Deskriptive Statistiken|Kreuztabellen..."; das Menü "Analysieren|Tabellen..." ist für kompliziertere oder spezielle Tabellen gedacht und wird hier zunächst nicht besprochen. Im Menü "Kreuztabellen..." steht links zunächst die Variablenliste. Rechts kann man den Variablen ihre Positionen in der Tabelle zuweisen: #Zeilen: Abhängige Variablen werden in der Regel in den Zeilen (quer) angeordnet. Manchmal kann es - vor allem bei einer großen Anzahl von Variablenausprägungen, z.B. bei Themenlisten für die Inhaltsanalyse - jedoch auch nötig sein, die unabhängige Variable in die Zeilen zu schreiben. #Spalten: Hier ist normalerweise der Platz für die unabhängige Variable in einer Tabelle (vertikal, die Ausprägungen der unabhängigen Variablen stehen im Kopf der Tabelle). #Schichten: Mit Hilfe einer Schichtung kann man getrennte Kreuztabellen für die Ausprägungen einer dritten Variablen erstellen lassen. Eine solche Drittvariablenkontrolle dient der Überprüfung vermuteter Scheinkorrelationen. ===Das Untermenü "Zellen..."=== Bei Kreuztabellen-Analysen ist das Untermenü "Zellen..." das wichtigste Einstellungswerkzeug. Es ermöglicht festzulegen, wie die Werte für die Kreuztabelle berechnet werden, was für die Interpretation der Daten entscheidend ist. Die für übliche Analysen relevanten Optionen sind: *'''Häufigkeiten''': "Beobachtet" bedeutet, daß die tatsächlich im Datensatz vorkommenden Zahlen, wie sie auch in einer Häufigkeitsauszählung stehen, in die Tabellenzellen geschrieben werden. "Erwartet" bedeutet, daß (meist zusätzlich) die Häufigkeiten angegeben werden, die statistisch bei einer Zufallsverteilung der Daten zu erwarten wären. *'''Prozentwerte''': Bei einer zeilenweisen Berechnung von Prozentwerten, ergeben die Zahlen in einer Zeile zusammen 100 Prozent. Bei der spaltenweisen Berechnung, ergeben die Zahlen einer Spalte zusammen 100 Prozent. Steht die unabhängige Variable im Kopf, ist fast immer auch die spaltenweise Prozentuierung sinnvoll. Bei einer Gesamtprozentuierung wird in jede Zelle eingetragen, wieviel Prozent der Zelleninhalt ausmacht, wenn die gesamte Tabelle 100 Prozent repräsentiert. Diese Einstellung wird unter anderem für Paneluntersuchungen gebraucht. *'''Residuen''' werden für den Vergleich von Erwartungswert und beobachtetem Wert gebraucht. *'''Gewichtungsfaktoren''' erleichtern die Arbeit mit Bruchwerten für Fälle bei Kreuztabellen in gewichteten Datensätzen. ===Weitere Untermenüs=== *Exakt...: Hiermit können sog. exakte Tests durchgeführt werden, um das Signifikanzniveau von Korrelationen zu untersuchen. Diese Funktion steht nicht in allen SPSS-Versionen zur Verfügung. *Statistik... ermöglicht die Berechnung von allerhand Korrelationskoeffizienten (siehe dort). *Format... dient der Einstellung des Tabellenaufbaus. [[Kategorie:SPSS-Kurs]] 88bd1917e2f920ac00a2c62f5e6c7b810284a867 130 111 2023-06-30T08:32:33Z Trg 1 /* Weitere Untermenüs */ Wort ausgeschrieben wikitext text/x-wiki '''Kreuztabellen''' geben bei der Analyse eines Datensatzes Auskunft über Zusammenhänge zwischen Variablen. Manchmal wird die Kreuztabelle auch nur als Werkzeug verwendet, um Daten zu vergleichen oder aufzubereiten, beispielsweise für Darstellungen im Zeitverlauf oder bei der [[Datenbereinigung]]. Kreuztablellen bestehen in der Regel aus einem Tabellenkopf, der die Spaltenbeschriftungen enthält und einer linken Randspalte, die die Zeilenbeschriftungen enthält. Wenn es sinnvoll möglich ist, werden die Summen der Spalten in der untersten Zeile aufgelistet, die Summen der Zeilen in der rechten Randspalte. Eine Kreuztabelle soll außerdem eine aussagekräftige Überschrift haben und ggf. Fußnoten, die Besonderheiten der Tabelle für den Leser nachvollziehbar erläutern. Fast immer stehen im Kopf der Tabellen die unabhängigen Variablen, also die, von denen man annimmt, dass sie auf andere Variablen wirken. Diese abhängigen Variablen stehen dann in den Zeilen der Tabelle. ==Beispiel== [[Datei:Kreuztabelle.jpg|left|mini|Kreuztabelle]] Diese Kreuztabelle (vgl. Kepplinger, Hans Mathias in Zusammenarbeit mit Marcus Maurer und Thomas Roessing [1999]: Deutschland vor der Wahl. Eine Frame-Analyse der Fernsehnachrichten. In: Elisabeth Noelle-Neumann / Hans Mathias Kepplinger / Wolfgang Donsbach (Hrsg.): Kampa. Meinungsklima und Medienwirkung im Bundestagswahlkampf 1998. Freiburg, München: Alber. S. 78-107.) stammt von einer Inhaltsanalyse zum Bundestagswahlkampf 1998. Dort wurde erhoben, ob bei Sachthemen die individuellen Ansprüche der Menschen, doer die Leistungskraft der Institutionen (z.B. Finanzierung des Arbeitslosengeldes) im Vordergrund stehen und wie CDU/CSU und SPD in diesen Beiträgen bewertet werden. Die Tabelle zeigt, dass, wenn in einem Beitrag die institutionelle Leistungskraft im Vordergrund steht, CDU/CSU und SPD ungefähr gleich bewertet werden. Stehen hingegen die individuellen Ansprüche der Menschen im Vordergrund, wird die SPD viel öfter positiv bewertet als die CDU/CSU. Da zudem die individuellen Ansprüche öfter den Blickwinkel der Beiträge bestimmen (Framing) als die institutionelle Leistungskraft: Vorteil für die Sozialdemokraten in der Berichterstattung! ==Kreuztabellen bei SPSS== ===Das Menü "Deskriptive Statistiken|Kreuztabellen..."=== Kreuztabellen erzeugt man mit SPSS am einfachsten über das Menü "Analysieren|Deskriptive Statistiken|Kreuztabellen..."; das Menü "Analysieren|Tabellen..." ist für kompliziertere oder spezielle Tabellen gedacht und wird hier zunächst nicht besprochen. Im Menü "Kreuztabellen..." steht links zunächst die Variablenliste. Rechts kann man den Variablen ihre Positionen in der Tabelle zuweisen: #Zeilen: Abhängige Variablen werden in der Regel in den Zeilen (quer) angeordnet. Manchmal kann es - vor allem bei einer großen Anzahl von Variablenausprägungen, z.B. bei Themenlisten für die Inhaltsanalyse - jedoch auch nötig sein, die unabhängige Variable in die Zeilen zu schreiben. #Spalten: Hier ist normalerweise der Platz für die unabhängige Variable in einer Tabelle (vertikal, die Ausprägungen der unabhängigen Variablen stehen im Kopf der Tabelle). #Schichten: Mit Hilfe einer Schichtung kann man getrennte Kreuztabellen für die Ausprägungen einer dritten Variablen erstellen lassen. Eine solche Drittvariablenkontrolle dient der Überprüfung vermuteter Scheinkorrelationen. ===Das Untermenü "Zellen..."=== Bei Kreuztabellen-Analysen ist das Untermenü "Zellen..." das wichtigste Einstellungswerkzeug. Es ermöglicht festzulegen, wie die Werte für die Kreuztabelle berechnet werden, was für die Interpretation der Daten entscheidend ist. Die für übliche Analysen relevanten Optionen sind: *'''Häufigkeiten''': "Beobachtet" bedeutet, daß die tatsächlich im Datensatz vorkommenden Zahlen, wie sie auch in einer Häufigkeitsauszählung stehen, in die Tabellenzellen geschrieben werden. "Erwartet" bedeutet, daß (meist zusätzlich) die Häufigkeiten angegeben werden, die statistisch bei einer Zufallsverteilung der Daten zu erwarten wären. *'''Prozentwerte''': Bei einer zeilenweisen Berechnung von Prozentwerten, ergeben die Zahlen in einer Zeile zusammen 100 Prozent. Bei der spaltenweisen Berechnung, ergeben die Zahlen einer Spalte zusammen 100 Prozent. Steht die unabhängige Variable im Kopf, ist fast immer auch die spaltenweise Prozentuierung sinnvoll. Bei einer Gesamtprozentuierung wird in jede Zelle eingetragen, wieviel Prozent der Zelleninhalt ausmacht, wenn die gesamte Tabelle 100 Prozent repräsentiert. Diese Einstellung wird unter anderem für Paneluntersuchungen gebraucht. *'''Residuen''' werden für den Vergleich von Erwartungswert und beobachtetem Wert gebraucht. *'''Gewichtungsfaktoren''' erleichtern die Arbeit mit Bruchwerten für Fälle bei Kreuztabellen in gewichteten Datensätzen. ===Weitere Untermenüs=== *Exakt...: Hiermit können sogenannte exakte Tests durchgeführt werden, um das Signifikanzniveau von Korrelationen zu untersuchen. Diese Funktion steht nicht in allen SPSS-Versionen zur Verfügung. *Statistik... ermöglicht die Berechnung von allerhand Korrelationskoeffizienten (siehe dort). *Format... dient der Einstellung des Tabellenaufbaus. [[Kategorie:SPSS-Kurs]] fa14069fa503e203a25d25925a6e209d6c101ce8 Fälle gewichten 0 30 112 64 2019-07-29T11:46:36Z Trg 1 fett wikitext text/x-wiki Fälle werden meist dann '''gewichtet''', wenn ihre Verteilung in einer Stichprobe nicht der Verteilung in der Grundgesamtheit entspricht. Sind beispielsweise deutlich mehr Frauen als Männer in einem Umfragedatensatz vertreten, müssen die Werte für die Frauen herunter- und die für die Männer heraufgewichtet werden um zu Ergebnissen zu kommen, die für eine Grundgesamtheit, in der Männer und Frauen ungefähr gleichverteilt sind, zutreffen. ==Gewichtungsfaktor== Ein einfaches Verfahren ist, das Verhältnis von Sollwert und Istwert zur Bildung von Gewichtungsfaktoren heranzuziehen. Angenommen, das Verhältnis Männer/Frauen in einer Grundgesamtheit sei 48% / 52%. Durch Stichproben-Fehler sind jedoch 39% Männer und 61% Frauen befragt worden. Der Gewichtungsfaktor ergibt sich jeweils aus dem Quotienten von Soll- und Istwert: G=Soll/Ist. Der Gewichtungsfaktor für die männlichen Befragten ist folglich 48% / 39% = 1,2. Der für die weiblichen Befragten ist 52% / 61% = 0,85. Durch Multiplikation der Werte in den übrigen Variablen mit den Gewichtungsfaktoren ergeben sich die gewichteten - und unter bestimmten Umständen für die Grundgesamtheit zutreffenderen - Ergebnisse. ==Beispiel== Für das Beispiel wird ein Datensatz mit 100 Fällen verwendet, der, wie oben geschildert, 39 männliche und 61 weibliche ältere Befragte repräsentiert, obwohl es eigentlich (nach der Verteilung in der Grundgesamtheit) 48 männliche und 52 weibliche Befragte sein sollten. Da Männer und Frauen ein unterschiedlich hohes Alter erreichen (Frauen werden im Durchschnitt älter), schlägt sich diese Verteilung auch im Durchschnittswert des Alters nieder. Für die Gewichtung bildet man nun eine Gewichtungsvariable, die die Gewichtungsfaktoren jeweils für Männer und Frauen (siehe oben) enthält. Das geht am einfachsten mit Hilfe der Funktion Berechnen unter Einsatz der Berechnungsbedingungen (falls sex=1 und falls sex=2). Als nächstes muß der Datensatz gewichtet werden. Dafür steht im Menü "Daten" ganz unten der Punkt "Fälle gewichten..." zur Verfügung. Das Fälle-Gewichten-Fenster erlaubt es auszuwählen, ob ein Datensatz gewichtet werden soll und eine Variable für die Gewichtung auszuwählen (Abbildung 3). Nach dem Gewichten (die tatsächlichen Fallzahlen bleiben dabei gleich!) gehen Männer stärker und Frauen schwächer in die SPSS-Berechnungen ein. Man beachte, daß die Fallzahlen in der Häufigkeitstabelle verändert erscheinen, obwohl sie im Datensatz unverändert sind. Die Gewichtung ist eine rein interne Prozedur, die sich nicht auf den tatsächlichen Datensatz auswirkt. Die Abweichung vom angestrebten Verhältnis 48/52 ergibt sich durch Rundungen während der Berechnungen. Vorsicht: Das Abspeichern von gewichteten Datensätzen ist heikel. Man kann sich beim Laden eines gewichtet gespeicherten Datensatzes nie sicher sein, ob die Gewichtung mit gespeichert wurde oder nicht. Außerdem ist es gefährlich, wenn man aus Versehen mit einem gewichteten Datensatz rechnet, aber glaubt, Rohdaten vor sich zu haben. Beim Arbeiten mit Gewichtungen ist zu empfehlen, nur ungewichtete Datensätze zu speichern und beim Arbeiten gelegentlich zu überprüfen, wie der Gewichtungsstatus ist. [[Kategorie:SPSS-Kurs]] c01249f4bc2ec96d893ff57ec8caadb12577c76c Hauptseite 0 1 113 98 2019-09-11T12:14:46Z Trg 1 akt. wikitext text/x-wiki <strong>Die Reparaturarbeiten laufen.</strong> Wegen eines Problems mit Updates musste diese Webseite neu aufgebaut werden. Einige Inhalte werden nicht wiederkehren. Zuerst sind die populären SPSS-Materialien dran. ==SPSS-Kurs-Materialien == Wiederaufbau abgeschlossen -- allerdings mit weniger Grafiken als früher (2019-05-06). *[[:Kategorie:SPSS-Kurs]] 2c19bb8e9d91cf59255cbdbf380b06518112902c 123 113 2020-11-10T13:16:04Z Trg 1 akt. wikitext text/x-wiki Wegen eines Problems mit Updates musste diese Webseite neu aufgebaut werden. Einige Inhalte werden nicht wiederkehren. Zuerst sind die populären SPSS-Materialien dran. ==SPSS-Kurs-Materialien == Wiederaufbau abgeschlossen -- allerdings mit weniger Grafiken als früher (2019-05-06). *[[:Kategorie:SPSS-Kurs]] 1eac4aec1e50f3af3cad1030f52e362b3feda75c Skalenniveau 0 48 114 2019-09-11T12:22:09Z Trg 1 redir wikitext text/x-wiki #REDIRECT [[Variablen_definieren#Messniveau]] 2f56fcee1dcb60bab3b6ec96730456e1cc8d549a 115 114 2019-09-11T12:23:38Z Trg 1 redir präz. wikitext text/x-wiki #REDIRECT [[Skalentypen]] a75105ef1cf32fda6b20b741d64f4fabb1ec42cf Variablen definieren 0 7 116 11 2019-09-11T12:27:30Z Trg 1 /* Messniveau */ Wikilink wikitext text/x-wiki Hier wird zuerst allgemein und dann an einem einfachen Beispiel erklärt, wie man vorgehen muß, wenn man einen Datensatz neu anlegt. == Erstellen der Datenoberfläche == Bevor man Daten eingeben kann, müssen die Variablen definiert werden. Dazu wechselt man zur Variablenansicht. Beim Definieren der Variablen kann man mehrere Einstellungen für die Variablen vornehmen, die das Verhalten von SPSS beim Rechnen mit diesen Variablen steuern und teilweise die Arbeit erheblich erleichtern. Name Variablennamen in SPSS durften früher maximal acht Zeichen lang sein (in den neuen Versionen ist das anders, aber im Interesse der Übersichtlichkeit und der Abwärtskompatibilität kann es nicht schaden, sich weiterhin an diesen Grundsatz zu halten). Variablennamen sollten möglichst ‚sprechend’ sein, also dem Nutzer einen Anhaltspunkt geben, was in dieser Variable gespeichert wird. Variablennamen wie ‚Wert1’ ‚Wert2’ etc. sind spätestens bei der Auswertung sehr verwirrend. ===Typ=== Hier wird in einem Auswahlfenster festgelegt, um welchen Typ Variable es sich handelt. Am häufigsten sind numerische Variablen (z.B. 1 für männlich, 2 für weiblich, Alter, Körpergröße etc.). Stringvariablen enthalten Texte. Sie sind sehr schwer auszuwerten. Für numerische Variablen kann man zusätzlich die Zahl der Stellen und der Nachkommastellen angeben. Achtung: Wenn negative Werte vorkommen können (z.B. bei der Bewertung von Politikern auf einer Stapel-Skala), muß für das Minus-Zeichen eine Stelle reserviert werden. ===Spaltenformat und Dezimalstellen=== Hier werden bei numerischen Variablen die unter ‚Typ’ erwähnten Angaben über die Zahl der Stellen festgelegt. ===Variablenlabel=== Eine Bezeichnung für die Variable, die auch mehr als acht Zeichen umfassen darf. Bei Auswertungen wird dieses Label mit angegeben, so daß man weiß, worum es in der analysierten Variable überhaupt geht. Beispielsweise kann man der Variable POLPRAEF das Variablenlabel ‚Politische Präferenz’ zuordnen. Das ist dann etwas klarer als der bloße Variablenname. ===Wertelabels=== Wenn man z.B. eine 1 für männlich und eine 2 für weiblich in den Datensatz einträgt, kann man den Werten in diesem Menü Bezeichnungen zuweisen. Sie werden bei Auswertungen mit ausgegeben. Man muß immer daran denken nach der Eingabe eines Wertelabels ‚Hinzufügen’ zu klicken, sonst funktioniert das Abschließen des Vorgangs mit ‚OK’ nicht richtig. ===Fehlende Werte=== Hier wird festgelegt, daß bestimmte Werte bei der Analyse nicht berücksichtigt werden sollen. Das ist beispielsweise dann nötig wenn man z.B. 9 für ‚keine Angabe’ verschlüsselt hat und nur mit den Fällen rechnen möchte, in denen eine Angabe gemacht wurde. Dann setzt man die 9 an dieser Stelle als ‚fehlenden Wert’ ein. Speziell bei Mittelwertvergleichen muß darauf geachtet werden, daß Sonderverschlüsselungen (wie 999 := "Alter nicht angegeben") bei der Berechnung der Mittelwerte nicht berücksichtigt werden. ===Spalten und Ausrichtung=== Mit diesen Einstellungen kann man das Aussehen der großen Datentabelle (‚Datenmatrix’) verändern. ===Messniveau=== Hier kann man einstellen, welches Datenniveau diese Variable haben soll. SPSS bietet drei [[Skalenniveau]]s an: *Metrisch. Damit sind Ratioskalen (mit absolutem Nullpunkt, z.B. Alter) und Intervallskalen (mit willkürlichem Nullpunkt, z.B. Grad Celsius) gemeint. *Ordinal. Ordinalskalen bringen Werte in eine Reihenfolge, ohne daß gesichert wäre, daß die Abstände zwischen den Skalenpunkten gleich sind. Beispiel: Schulnoten. *Nominal. Nominalskalen sind einfache Zuweisungen von Zahlen zu Ausprägungen, z.B. 1 für ‚männlich’ und 2 für ‚weiblich’. Das Meßniveau bestimmt, wie man mit den Daten der Variable rechnen kann. Manchmal ist es sinnvoll (bzw. wird einfach so gemacht), mehr zu berechnen, als man eigentlich darf. Deshalb ist es nicht verkehrt, das Meßniveau bei allen Variablen auf ‚Metrisch’ stehen zu lassen. Man muß dann lediglich beim Rechnen selbst daran denken, was man mit welchen Daten rechnen kann, und was nicht. ==Beispiel== Ein Beispiel für einen sehr einfachen Datensatz, der z.B. aus einem sozialwissenschaftlichen Experiment stammen könnte: Folgende Daten liegen auf den DIN-A4-Fragebögen vor: Gruppe (gehört der Befragte zur Experimentalgruppe A oder zur Kontrollgruppe B?) Geschlecht Alter Meinung über die SPD (fünfteilige Skala) Meinung über die CDU (fünfteilige Skala) Folgendermaßen kann die Umsetzung in SPSS-Variablen aussehen (wobei hier davon ausgegangen wird, daß Variablennamen nur acht Zeichen lang sein können, wie das bei früheren SPSS-Versionen der Fall war); genannt werden der Variablenname, die Ausprägungen und die empfohlenen Variablenlabels und das (offizielle) Meßniveau: GRUPPE: 1=Experimentalgruppe; 2=Kontrollgruppe (Nominalskala) SEX: 1=männlich; 2=weiblich; 9=keine Angabe (Nominalskala) ALTER: Alter in Jahren (Ratioskala/metrisch) SPDMNG: 1=sehr schlechte Meinung über die SPD; 3=ambivalente Meinung über die SPD; 5=sehr gute Meinung über die SPD; 9=keine Angabe (Ordinalskala) CDUMNG: 1=sehr schlechte Meinung über die CDU; 3=ambivalente Meinung über die CDU; 5=sehr gute Meinung über die CDU; 9=keine Angabe (Ordinalskala) [[Kategorie:SPSS-Kurs]] 1bbc1a839b171c339c357ca7edcc0743d4e4cd2e Berechnen 0 23 120 43 2020-03-07T16:36:11Z Trg 1 lemma fett wikitext text/x-wiki Die Funktion "'''Berechnen'''..." erreicht man über den ersten Eintrag im Menü "Transformieren". "Berechnen" wird verwendet, um aus den Werten einer oder mehrerer Variablen einen Wert für eine neue Variable zu berechnen. Die Funktion wird benötigt, um Indizes (Singular: Index) zu berechnen oder Variablen für Analysen zusammenzufassen, wenn Mehrfachantworten nicht geeignet sind. ==Das Berechnungs-Menü== Das Berechnungs-Menü enthält links eine Liste der verfügbaren Variablen. Darüber ist ein Feld für den Namen der Variable, in die das Ergebnis der Berechnung geschrieben werden soll. Rechts daneben ist das Feld, in das die Berechnungsvorschrift eingetragen wird. Darunter befindet sich die schon vom Fälle auswählen bekannte Tastatur zur Eingabe von Operatoren. Rechts sind Auswahlfelder für statistische und mathematische Funktionen. Im unteren Bereich des Fensters kann man, genau wie beim Recodieren, Bedingungen angeben, bei deren Vorliegen die Berechnung ausgeführt werden soll. ==Beispiel: Saldo== Für das Beispiel wurden die Variablen zur SPD-Meinung und CDU-Meinung der "Befragten" des Beispieldatensatzes so [[Recodieren|recodiert]], daß die Werte 1 und 2 (schlecht) zu -1, die Werte 4 und 5 (gut) zu +1 und die Mitte, die 3, zur 0 werden. Unter einem Saldo versteht man die Differenz zwischen positiven und negativen Bewertungen (wird häufig bei Inhaltsanalysen verwendet, um z.B. die Gesamttendenz eines Beitrages oder einer Sendung zu berechnen). Durch die Transformation von negativen Bewertungen in negative Zahlen und den Nullwert der neutralen Bewertung müssen die recodierten Variablen spdmngre und cdumngre nur noch addiert werden. Die neue Variable, in die das Ergebnis geschrieben wird, wird einfach "saldo" genannt (es ist immer praktisch, wenn Variablen "sprechende" Namen haben). Nach einem Klick auf OK werden für jeden Fall die recodierten Werte für CDU und SPD addiert und in die Variable saldo geschrieben. Wie beim Recodieren müssen neu berechnete Variablen zunächst in der Variablenansicht mit brauchbaren Eigenschaften versehen werden. Wenn negative Werte auftreten können, ist es wichtig auch bei einstelligen Variablen das Spaltenformat mit zwei Stellen anzugeben, weil eine für das Minuszeichen benötigt wird. Besonders wichtig sind die Variablen- und die Wertelabel, damit man später weiß, welche Berechnung zu der neuen Variable geführt hat und was die berechneten Werte bedeuten. Die Interpretation von Saldi kann durchaus anspruchsvoll sein. Im vorliegenden Fall könnte man die Summe der Meinungen zu SPD und CDU als Meinung über die Große Koalition interpretieren. -2 und +2 würden beispielsweise Ablehnung bzw. Zustimmung zu beiden Parteien und damit vermutlich auch zur Koalition bedeuten. Eine Häufigkeitsauszählung der neuen Variable gibt Auskunft darüber, wie beide Parteien insgesamt bewertet werden. ==Beispiel: Index== Ein weiteres Beispiel für den Nutzen der Funktion "Berechnen..." sind multiplikative oder additive Indices. Beispielsweise kann man jedem Befragten, der ein bestimmtes Item auswählt, einen oder zwei Punkte dafür geben. Dann kann man für jeden Befragten die Gesamtpunktzahl durch Addition ermitteln. Handelt es sich bei Nichtvorliegen eines bestimmten Items um ein "Totschlagkriterium", so wählt man einen multiplikativen Index: Der Indexwert wird Null, sofern einer der Ausgangswerte 0 ist. Derartige Indizes kann man beispielsweise verwenden, wenn die Eignung von Bewerbern überprüft werden soll. Hat ein Bewerber eine bestimmte Qualifikation nicht, wird die dafür stehende Null mit allen anderen Werten multipliziert, das Produkt wird Null und der Bewerber scheidet aus. Indices können freilich auch durch wesentlich kompliziertere Berechnungen als Addition und Multiplikation erzeugt werden. Die Vorgehensweise ist dann jedoch stark von den Gegebenheiten und Anforderungen des konkreten Projekts abhängig. [[Kategorie:SPSS-Kurs]] d2a53a1bb924ac688bbeaa867ff69dc9b085f703 Kategorie:SPSS-Kurs 14 8 121 103 2020-03-07T16:37:41Z Trg 1 geändert wikitext text/x-wiki ==SPSS== Der Wiederaufbau ist weitgehend abgeschlossen, aber mit weniger Grafiken als früher (2019-05-19) b2d7dceb5e7f137fab3e8d116a11f0f6b4b1a4fa Cronbachs Alpha 0 29 122 92 2020-04-25T15:16:44Z Trg 1 RS wikitext text/x-wiki '''Cronbachs Alpha''' ist ein Reliabilitätskoeffizient für Likert-Skalen und Item-Batterien beispielsweise aus Umfragen oder Inhaltsanalysen. Er gibt an, wie gut einzelne Skalen eines Messinstruments untereinander korrelieren, wie zuverlässig das Gesamtinstrument also eine bestimmte Dimension misst. Cronbachs Alpha sollte für eine kleine Anzahl von Items bei 0,7 oder darüber liegen. Cronbachs Alpha steigt jedoch bei gleicher Korrelation zwischen den Items mit der Zahl der Items an; bei einer Skala aus 20 Items beginnt der Wertebereich erst bei ca. 0,7, der konkrete Wert ist dann entsprechend anders zu interpretieren. Bei drei bis fünf Items ist die Verwendung von Cronbachs Alpha jedoch unbedenklich. ==Verwendung in SPSS== In SPSS wird Cronbachs Alpha auf Zwei Weisen verwendet. Erstens kann man sich für mehrere Items den Wert berechnen lassen, indem man unter Analysieren|Skalieren|Reliabilitätsanalyse... als Modell "Alpha" auswählt und OK klickt. Zweitens kann man sich für jedes Item anzeigen lassen, wie sich Cronbachs Alpha verändern würde, wenn man das fragliche Item aus der Skala entfernte. Das ist sehr praktisch um "schlechte" und "bessere" Items zu erkennen und ggf. seine Skala optimieren zu können. Dazu muß man unter Analysieren|Skalieren|Reliabilitätsanalyse...|Statistik... als Option "Skala wenn Item gelöscht" ankreuzen. ==Weblinks== [https://de.wikipedia.org/wiki/Cronbachs_Alpha Cronbachs Alpha bei de.wikipedia.org] [[Kategorie:SPSS-Kurs]] [[Kategorie:Statistik]] a92a15429ef8edc5af9d74163470f91e4e3a3178 129 122 2022-09-18T16:14:44Z Trg 1 /* Verwendung in SPSS */ Aktualisierung ergänzt wikitext text/x-wiki '''Cronbachs Alpha''' ist ein Reliabilitätskoeffizient für Likert-Skalen und Item-Batterien beispielsweise aus Umfragen oder Inhaltsanalysen. Er gibt an, wie gut einzelne Skalen eines Messinstruments untereinander korrelieren, wie zuverlässig das Gesamtinstrument also eine bestimmte Dimension misst. Cronbachs Alpha sollte für eine kleine Anzahl von Items bei 0,7 oder darüber liegen. Cronbachs Alpha steigt jedoch bei gleicher Korrelation zwischen den Items mit der Zahl der Items an; bei einer Skala aus 20 Items beginnt der Wertebereich erst bei ca. 0,7, der konkrete Wert ist dann entsprechend anders zu interpretieren. Bei drei bis fünf Items ist die Verwendung von Cronbachs Alpha jedoch unbedenklich. ==Verwendung in SPSS== In SPSS wird Cronbachs Alpha auf Zwei Weisen verwendet. Erstens kann man sich für mehrere Items den Wert berechnen lassen, indem man unter Analysieren|Skalieren|Reliabilitätsanalyse... als Modell "Alpha" auswählt und OK klickt. '''Aktualisierung (2022-09-18)''': Die Funktion findet sich nun unter Analysieren | Metrisch | Relibilitätsanalyse. Zweitens kann man sich für jedes Item anzeigen lassen, wie sich Cronbachs Alpha verändern würde, wenn man das fragliche Item aus der Skala entfernte. Das ist sehr praktisch um "schlechte" und "bessere" Items zu erkennen und ggf. seine Skala optimieren zu können. Dazu muß man unter Analysieren|Skalieren|Reliabilitätsanalyse...|Statistik... als Option "Skala wenn Item gelöscht" ankreuzen. ==Weblinks== [https://de.wikipedia.org/wiki/Cronbachs_Alpha Cronbachs Alpha bei de.wikipedia.org] [[Kategorie:SPSS-Kurs]] [[Kategorie:Statistik]] dde9d435e3224d70dec51701e2a25fc4ee538b1d Journalismus und Gesellschaft 0 49 124 2020-11-18T14:39:15Z Trg 1 Artikel erstellt wikitext text/x-wiki '''Journalismus und Gesellschaft''' ist ein Forschungsprojekt an der TU Dortmund. Mit aufeinander abgestimmten Umfragen unter Journalisten, Politikern und dem Publikum untersuchen die beteiligten Wissenschaftler das Verhältnis der drei Gruppen untereinander und gegenseitige Erwartungen. == Weblink == [http://www.journalismusstudie.fb15.tu-dortmund.de/ www.journalismusstudie.fb15.tu-dortmund.de] [[Category:Kommunikationswissenschaft]] 41df4556e5e847f0782f31b66275b2cff230194a Recodieren 0 20 125 39 2020-12-16T10:33:47Z Trg 1 test wikitext text/x-wiki Unter Recodieren versteht man das Umcodieren von Werten in Variablen. Dabei werden bestimmten Werten im Datensatz neue Werte zugewiesen, z.B. um Werte zusammenzufassen oder fehlerhafte Werte zu korrigieren. Die beiden Menüeinträge für "Umkodieren", "In dieselben Variablen..." und "In andere Variablen..." befinden sich im Menü "Transformieren". TEST ==Recodieren in dieselben Variablen== Beim Recodieren in dieselben Variablen werden die Werte innerhalb einer Variablen verändert. Diese Änderungen können in einem Datensatz nicht rückgängig gemacht werden. '''Gefahr!''' Das Recodieren in dieselben Variablen wird für Auswertungs- und Umformungszwecke niemals eingesetzt. Es kann ja sein, daß man irgendwann auf die Originaldaten zurückgreifen muß, um eine andere Art der Transformation durchzuführen. Bei der Datenbereinigung kann das Recodieren in dieselben Variablen nützlich sein, um eine große Zahl falscher Werte auf einmal zu korrigieren. '''Wegen möglicher Fehler darf das Verfahren aber auch dann nur angewandt werden, wenn eine Sicherungskopie des Datensatzes vorhanden ist!''' Hinsichtlich der Bedienung des Programms funktioniert das Recodieren in dieselben Variablen genau so wie das im nächsten Abschnitt besprochene Recodieren in andere Variablen. ==Recodieren in andere Variablen== Beim Recodieren in andere Variablen werden die alten Werte in neue Werte in einer neuen Variablen umgesetzt. Bei einer großen Zahl von Recodierungen wird ein Datensatz dadurch möglicherweise sehr groß. Man sollte sich deshalb genau aufschreiben, welche Recodierungen man unter welchen Bedingungen vorgenommen hat und die neu entstandenen Variablen sorgfältig definieren und labeln. ===Variablen auswählen und neue Variablen benennen=== Zuerst wählt man die Variable oder die Variablen, die man recodieren möchte, aus. In dem Beispieldatensatz für diese Darstellung sollen die Variablen SPDMNG und CDUMNG, die in fünfteiligen Skalen die Meinung zu den beiden Parteien von 1 := "sehr schlecht" bis 5 := "sehr gut" erfassen, zu dreistufigen Skalen zusammengefaßt werden. Nachdem die Variablen ausgewählt wurden, muß ganz rechts im Fenster einen Namen für die jeweilige Zielvariable und ein Label für diese Variable ausgewählt werden. Sowohl aus dem Namen, als auch aus dem Label sollte ersichtlich sein, daß die Variable recodiert wurde. ===Alte und neue Werte=== Auf der Seite der Quellvariablen kann man folgende Optionen auswählen: *Wert. Ein einzelner Wert, z.B. die 3 aus dem Beispiel, die zur 0 werden soll. *Systemdefiniert fehlend. Hiermit können Missings in Zahlen umgewandelt werden, z.B. in die 9 oder die 99, die bei Inhaltsanalysen und Umfragen oft bedeuten "keine Angabe". *System- oder benutzerdefiniert fehlende Werte. Wie der Punkt zuvor, aber einschließlich benutzerdefiniert fehlender Werte. *Bereich. Mehrere nebeneinanderliegende Werte, z.B. 1 und 2 oder 1 bis 5. *Bereich: kleinster Wert bis... *Bereich: größter Wert bis... *Alle anderen Werte. Diesen Eintrag schreibt man oft als letzten in die Liste der Transformationen und wählt auf der rechten Seite "Alte Werte kopieren". Der Eintrag lautet dann "else -> copy", damit wird sichergestellt, daß alle Werte, die nicht umkodiert werden sollen, in die neuen Variablen unverändert übernommen werden. Man kann sie aber genau so gut alle auf einen bestimmten Wert setzen oder in "systemdefiniert fehlend" ("missing") umwandeln, wenn man einen Teil der Werte nicht mehr braucht. Auf der Seite der Zielvariablen kann man auswählen: *Wert. Konkreter Wert, z.B. -1. *Systemdefiniert fehlend. Missing. *Alte Werte übernehmen. Keine Veränderung. Es empfiehlt sich, die Liste der Änderungen, die man hinzugefügt hat, nochmals aufmerksam zu überprüfen, bevor man "Weiter" klickt. Ein Tippfehler kann beim Recodieren dramatische Folgen haben! ===Bedingtes Recodieren=== Wenn die alten und die neuen Werte festgelegt sind, können noch Bedingungen festgelegt werden, unter denen die Recodierung durchgeführt werden soll. Dafür können alle Variablen und dieselben Rechenoperationen verwendet werden, wie beim Fälle auswählen. Die Funktion wird benötigt, wenn Recodierungen z.B. nur für eine bestimmte Gruppe bei einem Experiment oder für einen bestimmten Zeitraum bei einer Inhaltsanalyse vorgenommen werden sollen. ==Nach dem Recodieren== Nach dem Recodieren sollte das Ergebnis mit einer Häufigkeitsauszählung, ggf. auch durch einen Vergleich von Vorher- und Nachher-Ergebnissen überprüft werden. Beim Recodieren in neue Variablen müssen außerdem die Eigenschaften der Variablen, angefangen von der Spaltenbreite und der Zahl der Dezimalstellen, bis zu den Labels und den fehlenden Werten richtig eingestellt werden. [[Kategorie:SPSS-Kurs]] b034d28dd2bcfdfc985d90cc4a0891bfd9a7602a 126 125 2020-12-16T10:34:13Z Trg 1 Änderung 125 von [[Special:Contributions/Trg|Trg]] ([[User talk:Trg|Diskussion]]) rückgängig gemacht. wikitext text/x-wiki Unter Recodieren versteht man das Umcodieren von Werten in Variablen. Dabei werden bestimmten Werten im Datensatz neue Werte zugewiesen, z.B. um Werte zusammenzufassen oder fehlerhafte Werte zu korrigieren. Die beiden Menüeinträge für "Umkodieren", "In dieselben Variablen..." und "In andere Variablen..." befinden sich im Menü "Transformieren". ==Recodieren in dieselben Variablen== Beim Recodieren in dieselben Variablen werden die Werte innerhalb einer Variablen verändert. Diese Änderungen können in einem Datensatz nicht rückgängig gemacht werden. '''Gefahr!''' Das Recodieren in dieselben Variablen wird für Auswertungs- und Umformungszwecke niemals eingesetzt. Es kann ja sein, daß man irgendwann auf die Originaldaten zurückgreifen muß, um eine andere Art der Transformation durchzuführen. Bei der Datenbereinigung kann das Recodieren in dieselben Variablen nützlich sein, um eine große Zahl falscher Werte auf einmal zu korrigieren. '''Wegen möglicher Fehler darf das Verfahren aber auch dann nur angewandt werden, wenn eine Sicherungskopie des Datensatzes vorhanden ist!''' Hinsichtlich der Bedienung des Programms funktioniert das Recodieren in dieselben Variablen genau so wie das im nächsten Abschnitt besprochene Recodieren in andere Variablen. ==Recodieren in andere Variablen== Beim Recodieren in andere Variablen werden die alten Werte in neue Werte in einer neuen Variablen umgesetzt. Bei einer großen Zahl von Recodierungen wird ein Datensatz dadurch möglicherweise sehr groß. Man sollte sich deshalb genau aufschreiben, welche Recodierungen man unter welchen Bedingungen vorgenommen hat und die neu entstandenen Variablen sorgfältig definieren und labeln. ===Variablen auswählen und neue Variablen benennen=== Zuerst wählt man die Variable oder die Variablen, die man recodieren möchte, aus. In dem Beispieldatensatz für diese Darstellung sollen die Variablen SPDMNG und CDUMNG, die in fünfteiligen Skalen die Meinung zu den beiden Parteien von 1 := "sehr schlecht" bis 5 := "sehr gut" erfassen, zu dreistufigen Skalen zusammengefaßt werden. Nachdem die Variablen ausgewählt wurden, muß ganz rechts im Fenster einen Namen für die jeweilige Zielvariable und ein Label für diese Variable ausgewählt werden. Sowohl aus dem Namen, als auch aus dem Label sollte ersichtlich sein, daß die Variable recodiert wurde. ===Alte und neue Werte=== Auf der Seite der Quellvariablen kann man folgende Optionen auswählen: *Wert. Ein einzelner Wert, z.B. die 3 aus dem Beispiel, die zur 0 werden soll. *Systemdefiniert fehlend. Hiermit können Missings in Zahlen umgewandelt werden, z.B. in die 9 oder die 99, die bei Inhaltsanalysen und Umfragen oft bedeuten "keine Angabe". *System- oder benutzerdefiniert fehlende Werte. Wie der Punkt zuvor, aber einschließlich benutzerdefiniert fehlender Werte. *Bereich. Mehrere nebeneinanderliegende Werte, z.B. 1 und 2 oder 1 bis 5. *Bereich: kleinster Wert bis... *Bereich: größter Wert bis... *Alle anderen Werte. Diesen Eintrag schreibt man oft als letzten in die Liste der Transformationen und wählt auf der rechten Seite "Alte Werte kopieren". Der Eintrag lautet dann "else -> copy", damit wird sichergestellt, daß alle Werte, die nicht umkodiert werden sollen, in die neuen Variablen unverändert übernommen werden. Man kann sie aber genau so gut alle auf einen bestimmten Wert setzen oder in "systemdefiniert fehlend" ("missing") umwandeln, wenn man einen Teil der Werte nicht mehr braucht. Auf der Seite der Zielvariablen kann man auswählen: *Wert. Konkreter Wert, z.B. -1. *Systemdefiniert fehlend. Missing. *Alte Werte übernehmen. Keine Veränderung. Es empfiehlt sich, die Liste der Änderungen, die man hinzugefügt hat, nochmals aufmerksam zu überprüfen, bevor man "Weiter" klickt. Ein Tippfehler kann beim Recodieren dramatische Folgen haben! ===Bedingtes Recodieren=== Wenn die alten und die neuen Werte festgelegt sind, können noch Bedingungen festgelegt werden, unter denen die Recodierung durchgeführt werden soll. Dafür können alle Variablen und dieselben Rechenoperationen verwendet werden, wie beim Fälle auswählen. Die Funktion wird benötigt, wenn Recodierungen z.B. nur für eine bestimmte Gruppe bei einem Experiment oder für einen bestimmten Zeitraum bei einer Inhaltsanalyse vorgenommen werden sollen. ==Nach dem Recodieren== Nach dem Recodieren sollte das Ergebnis mit einer Häufigkeitsauszählung, ggf. auch durch einen Vergleich von Vorher- und Nachher-Ergebnissen überprüft werden. Beim Recodieren in neue Variablen müssen außerdem die Eigenschaften der Variablen, angefangen von der Spaltenbreite und der Zahl der Dezimalstellen, bis zu den Labels und den fehlenden Werten richtig eingestellt werden. [[Kategorie:SPSS-Kurs]] c254bae985f5bc742954368b394415165c9e7d2a Test auf Normalverteilung 0 34 128 101 2021-12-01T20:37:05Z Trg 1 /* Kolmogorov-Smirnov-Test */ korr. wikitext text/x-wiki Viele statistische Verfahren setzen voraus, daß die Daten (der Stichprobe) zumindest annähernd normalverteilt sind. Um diese Voraussetzung zu prüfen, bietet SPSS im Menü "Deskriptive Statistik|Explorative Datenanalyse" zwei statistische Testmöglichkeiten. Darüber hinaus sind in einige andere Analyseprozeduren Tests auf [[Normalverteilung]] integriert. Es gibt allerdings kaum eindeutige Kriterien, ab wann eine Abweichung von der Normalverteilung ein statistisches Verfahren wirklich stört. Bedenklich werden Abweichungen jedenfalls dann, wenn eine Verteilung sehr schief oder mehrgipflig ist. ==Kolmogorov-Smirnov-Test== Der Kolmogorov-Smirnov-Test kann unter "Explorative Datenanalyse..." ausgewählt werden, indem man auf "Diagramme" klickt und dann "Normalverteilungsdiagramm mit Tests" markiert. Relevant für die Interpretation ist die Angabe bei "Signifikanz". Je kleiner dieser Wert ist, desto unwahrscheinlicher ist eine Normalverteilung. Wenn SPSS hier .000 ausgibt, sollte auf jeden Fall Abstand von einer Annahme der Normalverteilung genommen werden. ==Shapiro-Wilk-Test== Die Interpretation dieses Tests funktioniert genau wie die des Kolmogorov-Smirnov-Tests. Wenn die Zahl unter Signifikanz sehr klein oder gar .000 ist, kann man nicht vom Vorliegen einer Normalverteilung ausgehen. ==Sichtprüfung mit Graphiken== Die beiden statistischen Tests werden in der Literatur kaum behandelt und sind offenbar nicht besonders bedeutend. Einer anderen Vorgehensweise zum Test auf Normalverteilung wird dagegen große Bedeutung zugemessen: Dem einfachen Sichtvergleich einer Graphik der Stichprobendaten mit einem Bild einer Normalverteilung. Ist die Ähnlichkeit hinreichend groß (das heißt in den meisten Fällen: Ähnlichkeit mit einer symmetrischen, eingipfligen Glockenkurve), kann man davon ausgehen, daß die Anforderung "normalverteilt" erfüllt ist. ==Histogramm bei der Häufigkeitsauszählung== Bei einer Häufigkeitsauszählung kann mit Hilfe der Schaltfläche "Diagramme" eingestellt werden, daß ein "Histogramm mit Normalverteilungskurve" ausgegeben werden soll. Das Ergebnis sieht dann z.B. folgendermaßen aus: [[Datei:Histogramm1.jpg]] [[Datei:Histogramm2.jpg]] Das erste Bild zeigt eine mehrgipflige Verteilung, die keine Ähnlichkeit mit der Normalverteilung hat. Kolmogorov-Smirnov-Test und Shapiro-Wilk-Test ergeben für diese Daten eine Signifikanz von .000, bestätigen also den optischen Eindruck, daß hier keine Normalverteilung angenommen werden darf. Das zweite Bild ähnelt ganz offensichtlich einer Normalverteilung. Die Werte der beiden Tests sind für diese Daten deutlich größer als .000, allerdings kaum zu interpretieren. In solchen Fällen verlässt man sich besser auf den optischen Eindruck. ==Q-Q-Diagramm und trendbereinigtes Q-Q-Diagramm== Unter "Deskriptive Statistiken|Explorative Datenanalyse..." werden zusammen mit den beiden statistischen Tests auch zwei Graphiken mit ausgegeben. Die erste Graphik ist ein Q-Q-Diagramm, das die Meßwerte mit einer Gerade vergleicht, die eine Normalverteilung repräsentiert. Streuen die Werte eng und zufällig um die Gerade, kann man eine Normalverteilung der Daten annehmen. [[Datei:Qq1.jpg]] Die zweite Graphik, die SPSS zusammen mit den beiden statistischen Tests ausgibt (trendbereinigtes Q-Q-Diagramm), erfüllt einen ähnlichen Zweck wie die erste, nur daß die Linie, die die Normalverteilung repräsentiert, nun horizontal ist. Die besten Aussichten auf normalverteilte Daten hat man, wenn die Daten zufällig und ohne Muster um die horizontale Linie streuen. [[Kategorie:SPSS-Kurs]] bb5204fbfe77bcaafc17b88a70caa134d4f06d90 Mehrfachantworten 0 26 131 62 2024-01-16T11:47:00Z Trg 1 /* Beispiele */ + Leerzeile wikitext text/x-wiki Mehrfachantworten braucht man, wenn mehrere Variablen zu Sets zusammengefaßt werden müssen. Das ist zum Beispiel dann der Fall, wenn auf eine Frage mehrere Antworten gegeben werden können oder bei Inhaltsanalysen mehrere Ausprägungen einer Eigenschaft der Analyseeinheit verschlüsselt werden sollen. ===Beispiele=== '''Befragung:''' Welche der folgenden Städte haben Sie schon einmal besucht (Mehrfachantworten möglich): [ ] London [ ] Düsseldorf [ ] Hamburg [ ] Rom [ ] Montreal [ ] keine der genannten Städte '''Inhaltsanalyse:''' Für jeden Beitrag können bis zu drei Themen verschlüsselt werden. Thema 1: [ ][ ][ ] Thema 2: [ ][ ][ ] Thema 3: [ ][ ][ ] ==Sets definieren== Die Mehrfachantworten-Funktionen von SPSS haben ein eigenes Menü recht weit unten im "Analysieren"-Menü: "Mehrfachantwort...|Sets-definieren", "|Häufigkeiten" und "|Kreuztabellen". Mit den Mehrfachantworten-Sets kann nur über dieses Menü gearbeitet werden. Das Auswahlfenster für "Sets definieren" besteht aus einer Variablenliste links, aus der die zu verbindenden Variablen ausgewählt werden können. Ausgewählte Variablen werden in der entsprechenden Liste angezeigt. Unter den Variablenlisten können folgende Einstellungen vorgenommen werden: *Bei dichotomen Variablen: Gezählter Wert. Trägt man beispielsweise bei allen Befragten, die eine bestimmte Stadt schon einmal besucht haben, eine 1 ein (und 0 für 'nicht besucht') würde man als gezählten Wert für diese Dichotomie 1 angeben. *Bei kategorialen Variablen: Bereich, der berücksichtigt werden soll. Hat man beispielsweise bei einer Inhaltsanalyse eine Themenliste von 100 bis 955 und will für die Mehrfachantworten-Analyse die Werte 200-800 berücksichtigen, würde man die entsprechenden Werte hier in die Felder eintragen. *Name. Name für das Set; SPSS stellt ihm automatisch ein Dollarzeichen ($) voran. *Beschriftung. Ein Label für das Set, ggf. aussagekräftiger als der Name. Ein Klick auf "Hinzufügen" fügt das Set der Mehrfachantworten-Set-Sammlung hinzu. Mit "Ändern" kann man ein Set nachträglich bearbeiten und mit "Entfernen" löschen. Mehrfachantworten-Sets, die mit Hilfe dieser Prozedur erzeugt wurden, können nicht gespeichert werden. Sie gehen bei Beendigung von SPSS verloren und müssen in der nächsten Sitzung neu eingerichtet werden. In der SPSS-Version 14 gibt es unter dem Menüpunkt Daten|Mehrfachantworten-Sets die Möglichkeit, Mehrfachantwortensetzt dauerhaft anzulegen. Diese Sets können allerdings nur in benutzerdefinierten Tabellen und Diagrammen verwendet werden. Anderen Prozeduren (z.B. den herkömmlichen [[Kreuztabellen]]) stehen sie nicht zur Verfügung. ==Häufigkeiten für Mehrfachantworten-Sets== Über das Bedienfenster für die Häufigkeitsauszählung bei Mehrfachantworten-Sets kann man die Sets auswählen, für die man eine Häufigkeitsauszählung haben möchte. Außerdem kann man angeben, was bei fehlenden Werten geschehen soll: Listenweiser Ausschluß bedeutet, daß Fälle mit mindestens einem Missing in einer der beteiligten Variablen ganz aus der Tabelle ausgeschlossen werden. In der Häufigkeitstabelle fällt zunächst eine Unterscheidung auf, die bei Mehrfachantwortensets äußerst wichtig ist: "Prozent" und "Prozent der Fälle". *'''Prozent (der Antworten''') bedeutet, daß die Zahl der Antworten die Basis für die Prozentuierung bildet. Wie der Name Mehrfachantworten schon sagt, liegt die Zahl der Antworten oft über der Zahl der Fälle. Wenn jeder Befragte bis zu drei Städte besucht haben kann, ist die maximale Zahl der Antworten das Dreifache der Befragtenzahl. *'''Prozent der Fälle''' bedeutet, daß als Basis für die Prozentuierung der Antworten die Zahl der Befragten verwendet wird. In der Regel entstehen hier also Prozentsummen von über 100 Prozent. ==Kreuztabellen für Mehrfachantworten-Sets== Mehrfachantworten-Sets können sowohl untereinander, als uach mit Einzelvariablen "gekreuzt" werden. Das Bedienfenster dafür entspricht in etwa dem für normale Kreuztabellen. Zusätzlich müssen jedoch zwei Einstellungen unter "Optionen" vorgenommen werden. *"'''Variablen aus den Sets paaren'''" wird benötigt, wenn die Variablen aus Set1 und Set2 irgendwie zusammengehören. Beispiel: Wenn man bei einer Inhaltsanalyse drei Themen pro Beitrag verschlüsselt und zu jedem Thema eine besondere Eigenschaft, hängen Thema1 und Eigenschaft1, Thema2 und Eigenschaft2 etc. miteinander zusammen. In diesen Fällen sollte die Option zur Paarung von Variablen angekreuzt werden. *Wie bei der Häufigkeitstabelle muß man angeben, ob Prozentwerte auf '''Fälle''' oder '''Antworten''' bezogen sein sollen. [[Kategorie:SPSS-Kurs]] d2ef7e04d5118918c0eb74f54276dd2827dc05c3